Skip to content

Releases: xkeyC/fl_caption

V0.0.12

24 Mar 13:55

Choose a tag to compare

V0.0.12 Pre-release
Pre-release

Full Changelog: v0.0.11...v0.0.12

  • 移除 flash-attn 因为存在兼容性问题
  • 优化编译时的 CUDA_COMPUTE_CAP 版本以尝试兼容更多显卡
  • 增加 ja-anime-v0.1 语音模型

V0.0.11

23 Mar 03:59

Choose a tag to compare

V0.0.11 Pre-release
Pre-release

Full Changelog: v0.0.10...v0.0.11

  • 优化 VAD 模型过滤效果
  • 新增 VAD 强度调节

V0.0.10

22 Mar 16:37

Choose a tag to compare

V0.0.10 Pre-release
Pre-release

Full Changelog: v0.0.9...v0.0.10

  • 新增 flash-attention 优化推理性能
  • 新增 VAD 模型过滤音频,减少 whisper 在纯音乐/安静场景中的幻觉
  • 实现 Whisper 低分输出过滤功能

V0.0.9

21 Mar 12:14

Choose a tag to compare

V0.0.9 Pre-release
Pre-release

What's Changed

  • 优化设置 UI
  • 推理周期设置改为毫秒
  • 合并多声道音频,现在使用多个声道合并后的音频去推理,获得更好的推理效果
  • large-v2_q4_1large-v3-turbo_q4_1 模型替换为 q4_k 量化,获得更好的推理效果
  • 合并多个 whisper 配置文件,减少包体积

New Contributors

Full Changelog: v0.0.8...v0.0.9

V0.0.8

20 Mar 14:09

Choose a tag to compare

V0.0.8 Pre-release
Pre-release

Full Changelog: v0.0.7...v0.0.8

  • 新增了 large-v2_q4_1large-v3-turbo_q4_1 量化模型,可降低显存占用
  • 优化设置项 UI

V0.0.7

19 Mar 14:38

Choose a tag to compare

V0.0.7 Pre-release
Pre-release

What's Changed

Full Changelog: v0.0.6...v0.0.7

  • 新的设置 UI
  • 增加推理设置功能
  • 增加 large-v2 模型

V0.0.6

18 Mar 14:47

Choose a tag to compare

V0.0.6 Pre-release
Pre-release

Full Changelog: v0.0.5...v0.0.6

  • 优化错误日志展示
  • 降低 CUDA 版本要求,请确保:nvidia-smi --query-gpu=compute_cap --format=csv 输出大于等于 7.5 nvidia-smi CUDA 版本输出 大于等于12.4
  • 优化设置页面 LLM Api 提示文字

V0.0.5

17 Mar 14:06

Choose a tag to compare

V0.0.5 Pre-release
Pre-release

Full Changelog: v0.0.4...v0.0.5

  • 将字幕语言中的中文拆分为 简体中文 与 繁体中文
  • CUDA 初始化失败时将弹出错误信息 并回退到 CPU 实现
  • 优化 UI 加载流程
  • 优化语音拾取的内存占用
  • 优化 UI 布局

V0.0.4

16 Mar 14:07

Choose a tag to compare

V0.0.4 Pre-release
Pre-release

Full Changelog: v0.0.3...v0.0.4

  • 升级candle 到 0.8.4
  • 增加了 large-v3-turbo 模型支持,该模型可大幅改善推理速度
  • 修复了数据库存储位置,之前错误的存储在了文档中,0.0.3及以前的更新至该版本后以前的配置将丢失(模型不会),请重新配置设置,建议删除用户文档下的 settings.hivesettings.lock

V0.0.3

15 Mar 13:56

Choose a tag to compare

V0.0.3 Pre-release
Pre-release

What's Changed

New Contributors

  • @xkeyC made their first contribution in #2

Full Changelog: v0.0.2...v0.0.3

  • 改进 Whisper 推理超时控制
  • 实现 LLM 调用超时控制
  • 更新依赖库
  • 修复窗口关闭操作
  • 支持 HF_ENDPOINT 环境变量