Speach Recognitions

Overview

easy_meeting

photo_2021-10-20 12 07 05

Добро пожаловать в интерфейс сервиса автопротоколирования совещаний Easy Meeting.

Website - http://cf5c-62-192-251-83.ngrok.io/

Принципиально данный сервис можно разделить на три основных и два дополнительных шага.

К основным шагам относится:
💁 Загрузка файла в сервис;
💁 Обработка файла;
💁 Редактирование и сохранение.

Дополнительные шаги включают в себя:
🧐 Получение саммари текста
🤓 Возможность задать вопросы к тексту (возможность поиска по ключевым словам)

Первым этапом работы сервиса является загрузка в него исходного файла. Сервис Easy Meeting может принимать файл из 2-х источников: Загрузить файлы с устройства; Вставить ссылку с YouTube. Во время загрузки файла вам не нужно думать о его формате. Данный сервис работает со всеми форматами (видео/аудио).

01

Для того чтобы загрузить файл с компьютера, необходимо нажать на кнопку “Загрузить файл с устройства”, после чего появится возможность выбрать файл с диска.

02

Если у вас есть ссылка на YouTube, то выберите пункт “Укажите ссылку на YouTube”, после чего вставьте необходимую ссылку в поле.

03

Ожидайте загрузку файла.

04

После того как вы выбрали один из методов загрузки файла и загрузили его в сервис Easy Meeting, вы увидите надпись “Данные загружены! Теперь можно приступить к извлечению файла”.

Чтобы начать обработку файла и извлечение текста из аудио, нажмите кнопку “Обработать”. Начнется обработка файла, вы увидите прогресс бар, в котором будет отражено время выполнения алгоритма преобразования речи в текст.

12

После того как прогресс бар будет заполнен на 100% , появится сообщение “Текст распознан! Теперь его можно посмотреть и при необходимости отредактировать”.

Ниже вы увидите окошко, в котором будет весь распознанный текст с возможностью его редактирования.

07

Когда закончите с редактированием, то ниже данного окошка появятся две кнопки: “Скачать аудио” и “Скачать распознанный текст”.

Также в нашем сервисе предусмотрены две дополнительные функции:

  1. Функция суммаризации текста
  2. Q&A с текстом 💁

08

Для того чтобы получить краткое описание всей конференции и не читать все страницы, вы можете получить выжимку, нажав на кнопку “Получить краткое содержание”, в результате наш алгоритм предложит вам сжатую версию конференции, которой вы сможете ознакомиться с основными тезисами любой встречи.

09

Вторая не менее важная дополнительная функция доступна в интерфейсе в левой части экрана и появляется только после обработки аудио и получения полной версии текста. В данной функции вы сможете задать вопрос по тексту.

11

Например, если вы пропустили совещание и не знаете, шла ли речь о вас или нет 🤓 🙈 вы можете спросить у нейронной сети, что говорили про (конечно) Ивана Ивановича Иванова.

После того как файл обработан и все необходимые файлы скачаны, вы можете проделать эту процедуру еще раз. Для этого просто вернитесь к первому шагу выбора файла.

В связи с ограниченными ресурсами hardware, оптимальное время работы алгоритмов:

Из расчёта записи в 1 час.

  1. Загрузка файла ~2 минут
  2. Обработка файла и получение транскрибации ~ 5 минут
  3. Суммаризация текста ~ 3 минуты
  4. Q&A ~ 1-2 минуты

Для локального запуска необходимо в корневой директории проекта создать папку "models"
В нее поместить файлы находящиеся в папке models на облаке:
https://drive.google.com/drive/folders/1Bkzutf6FJf7Qm05GEf9C6Dmd05wBzjjk?usp=sharing

Далее запустить в cmd:
pip install -r requirements.txt
streamlit run app_run.py

Все глобальные переменные для моделей изменяются в config.py

Спасибо! Надеемся, вам понравился наш быстрый и удобный сервис Easy Meeting!

С уважением,
команда Teenage Mutant Ninja Turtles (TMNT)

10

Owner
Maksim
Maksim
Code for the paper "A Simple but Tough-to-Beat Baseline for Sentence Embeddings".

Code for the paper "A Simple but Tough-to-Beat Baseline for Sentence Embeddings".

1.1k Dec 27, 2022
Free and Open Source Machine Translation API. 100% self-hosted, offline capable and easy to setup.

LibreTranslate Try it online! | API Docs | Community Forum Free and Open Source Machine Translation API, entirely self-hosted. Unlike other APIs, it d

3.4k Dec 27, 2022
🗣️ NALP is a library that covers Natural Adversarial Language Processing.

NALP: Natural Adversarial Language Processing Welcome to NALP. Have you ever wanted to create natural text from raw sources? If yes, NALP is for you!

Gustavo Rosa 21 Aug 12, 2022
Source code of the "Graph-Bert: Only Attention is Needed for Learning Graph Representations" paper

Graph-Bert Source code of "Graph-Bert: Only Attention is Needed for Learning Graph Representations". Please check the script.py as the entry point. We

14 Mar 25, 2022
IMDB film review sentiment classification based on BERT's supervised learning model.

IMDB film review sentiment classification based on BERT's supervised learning model. On the other hand, the model can be extended to other natural language multi-classification tasks.

Paris 1 Apr 17, 2022
✨Rubrix is a production-ready Python framework for exploring, annotating, and managing data in NLP projects.

✨A Python framework to explore, label, and monitor data for NLP projects

Recognai 1.5k Jan 02, 2023
Quick insights from Zoom meeting transcripts using Graph + NLP

Transcript Analysis - Graph + NLP This program extracts insights from Zoom Meeting Transcripts (.vtt) using TigerGraph and NLTK. In order to run this

Advit Deepak 7 Sep 17, 2022
PyTorch Implementation of VAENAR-TTS: Variational Auto-Encoder based Non-AutoRegressive Text-to-Speech Synthesis.

VAENAR-TTS - PyTorch Implementation PyTorch Implementation of VAENAR-TTS: Variational Auto-Encoder based Non-AutoRegressive Text-to-Speech Synthesis.

Keon Lee 67 Nov 14, 2022
Super easy library for BERT based NLP models

Fast-Bert New - Learning Rate Finder for Text Classification Training (borrowed with thanks from https://github.com/davidtvs/pytorch-lr-finder) Suppor

Utterworks 1.8k Dec 27, 2022
Converts text into a PDF of handwritten notes

Text To Handwritten Notes Converts text into a PDF of handwritten notes Explore the docs » · Report Bug · Request Feature · Steps: $ git clone https:/

UVSinghK 63 Oct 09, 2022
A simple Flask site that allows users to create, update, and delete posts in a database, as well as perform basic NLP tasks on the posts.

A simple Flask site that allows users to create, update, and delete posts in a database, as well as perform basic NLP tasks on the posts.

Ian 1 Jan 15, 2022
The first online catalogue for Arabic NLP datasets.

Masader The first online catalogue for Arabic NLP datasets. This catalogue contains 200 datasets with more than 25 metadata annotations for each datas

ARBML 94 Dec 26, 2022
ThinkTwice: A Two-Stage Method for Long-Text Machine Reading Comprehension

ThinkTwice ThinkTwice is a retriever-reader architecture for solving long-text machine reading comprehension. It is based on the paper: ThinkTwice: A

Walle 4 Aug 06, 2021
Sentiment Classification using WSD, Maximum Entropy & Naive Bayes Classifiers

Sentiment Classification using WSD, Maximum Entropy & Naive Bayes Classifiers

Pulkit Kathuria 173 Jan 04, 2023
Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents

Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents [Project Page] [Paper] [Video] Wenlong Huang1, Pieter Abbee

Wenlong Huang 114 Dec 29, 2022
Count the frequency of letters or words in a text file and show a graph.

Word Counter By EBUS Coding Club Count the frequency of letters or words in a text file and show a graph. Requirements Python 3.9 or higher matplotlib

EBUS Coding Club 0 Apr 09, 2022
Simple tool/toolkit for evaluating NLG (Natural Language Generation) offering various automated metrics.

Simple tool/toolkit for evaluating NLG (Natural Language Generation) offering various automated metrics. Jury offers a smooth and easy-to-use interface. It uses datasets for underlying metric computa

Open Business Software Solutions 129 Jan 06, 2023
Python code for ICLR 2022 spotlight paper EViT: Expediting Vision Transformers via Token Reorganizations

Expediting Vision Transformers via Token Reorganizations This repository contain

Youwei Liang 101 Dec 26, 2022
Use AutoModelForSeq2SeqLM in Huggingface Transformers to train COMET

Training COMET using seq2seq setting Use AutoModelForSeq2SeqLM in Huggingface Transformers to train COMET. The codes are modified from run_summarizati

tqfang 9 Dec 17, 2022
✔👉A Centralized WebApp to Ensure Road Safety by checking on with the activities of the driver and activating label generator using NLP.

AI-For-Road-Safety Challenge hosted by Omdena Hyderabad Chapter Original Repo Link : https://github.com/OmdenaAI/omdena-india-roadsafety Final Present

Prathima Kadari 7 Nov 29, 2022