windows 离线语音转文本、语音转文本、实时字幕工具
功能亮点
完全本地推理与存储,不依赖网络
不依赖 GPU ,CPU 速度飞快
功能介绍
CPU 飞快
i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU )
i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU )
实时识别
支持识别麦克风、系统声音或者双路同时识别。
支持字幕和语音输入模式,支持同步翻译(通过自部署 LLM 模型,推荐 HY - MT1.5-1.8B ,速度极快)
识别音视频文件
支持主流音视频文件。
内置 FFMpeg 处理,可以转换各种格式。
说话人管理
内置说话人管理
可以为每个说话人指定模型进行识别
强大的编辑与搜索功能
支持自定义词典。自动调用词典内容进行后处理。
支持手动编辑,点击识别文本自动跳转到对应音频。
支持批量删除与替换
支持全局搜索
本地 LLM 支持
内置 ollama 接口,支持一键启动,一键处理。
可以自定义提示词,使用本地部署的 LLM 模型进行润色、翻译、总结等任务
语言支持
普通话( 97%)、中文方言( 90%)、英语( 95%)、韩语、日语以及意大利语( 97%)、西班牙语( 96%)、葡萄牙语( 95%)、德语( 95%)、法语( 95%)、俄语( 94%)、乌克兰语( 93%)、波兰语( 93%)、荷兰语( 93%)等 25 种欧洲语言