[kopa]dev

❯ Технические заметки инженера-программиста

[AI lab] Из видео в текст, из текста в аудио

Whisper. Транскрибация аудио локальной моделью Привет! Решил попробовать поиграть с AI модельками. Взял библиотеку whisper от OpenAI (создатели chatGPT). Давайте посмотрим что она умеет. Репозиторий с исходным кодом Что это вообще такое? Whisper — это универсальная модель распознавания речи. Она обучена на большом наборе данных разнообразных аудиофайлов и является многозадачной моделью, способной выполнять многоязычное распознавание речи, перевод речи и идентификацию языка. Выбор видео Взял мемное видео, скачал его себе на ноутбук с помощью первого найденного сервиса. ...

марта 2, 2026 · 8 минут · Pavel Kozlov

Code Syntax Guide

Sample article showcasing basic code syntax and formatting for HTML elements.

марта 10, 2019 · 2 минуты · Aditya Telange