Releases · xkeyC/fl_caption

24 Mar 13:55

xkeyC

v0.0.12

b308f13

V0.0.12 Pre-release

Pre-release

Full Changelog: v0.0.11...v0.0.12

移除 flash-attn 因为存在兼容性问题
优化编译时的 CUDA_COMPUTE_CAP 版本以尝试兼容更多显卡
增加 ja-anime-v0.1 语音模型

Assets 3

23 Mar 03:59

xkeyC

v0.0.11

3f4aa9e

V0.0.11 Pre-release

Pre-release

Full Changelog: v0.0.10...v0.0.11

优化 VAD 模型过滤效果
新增 VAD 强度调节

Assets 3

22 Mar 16:37

xkeyC

v0.0.10

0bfb646

V0.0.10 Pre-release

Pre-release

Full Changelog: v0.0.9...v0.0.10

新增 flash-attention 优化推理性能
新增 VAD 模型过滤音频，减少 whisper 在纯音乐/安静场景中的幻觉
实现 Whisper 低分输出过滤功能

Assets 3

21 Mar 12:14

xkeyC

v0.0.9

5753f17

V0.0.9 Pre-release

Pre-release

What's Changed

feat: impl WhisperModelConfigType by @xkeyC in #19
feat: merge_channels by @xkeyC in #16
build(deps): bump ffigen from 16.1.0 to 18.0.0 by @dependabot in #18

优化设置 UI
推理周期设置改为毫秒
合并多声道音频，现在使用多个声道合并后的音频去推理，获得更好的推理效果
large-v2_q4_1 与 large-v3-turbo_q4_1 模型替换为 q4_k 量化，获得更好的推理效果
合并多个 whisper 配置文件，减少包体积

New Contributors

@dependabot made their first contribution in #18

Full Changelog: v0.0.8...v0.0.9

Contributors

dependabot and xkeyC

Assets 3

20 Mar 14:09

xkeyC

v0.0.8

33bfb12

V0.0.8 Pre-release

Pre-release

Full Changelog: v0.0.7...v0.0.8

新增了 large-v2_q4_1 与 large-v3-turbo_q4_1 量化模型，可降低显存占用
优化设置项 UI

Assets 3

19 Mar 14:38

xkeyC

v0.0.7

faebe83

V0.0.7 Pre-release

Pre-release

What's Changed

Feat/new settings by @xkeyC in #13

Full Changelog: v0.0.6...v0.0.7

新的设置 UI
增加推理设置功能
增加 large-v2 模型

Contributors

xkeyC

Assets 3

18 Mar 14:47

xkeyC

v0.0.6

baf0f2f

V0.0.6 Pre-release

Pre-release

Full Changelog: v0.0.5...v0.0.6

优化错误日志展示
降低 CUDA 版本要求，请确保：nvidia-smi --query-gpu=compute_cap --format=csv 输出大于等于 7.5 nvidia-smi CUDA 版本输出大于等于12.4
优化设置页面 LLM Api 提示文字

Assets 3

17 Mar 14:06

xkeyC

v0.0.5

f63615f

V0.0.5 Pre-release

Pre-release

Full Changelog: v0.0.4...v0.0.5

将字幕语言中的中文拆分为简体中文与繁体中文
CUDA 初始化失败时将弹出错误信息并回退到 CPU 实现
优化 UI 加载流程
优化语音拾取的内存占用
优化 UI 布局

Assets 3

16 Mar 14:07

xkeyC

v0.0.4

3987c04

V0.0.4 Pre-release

Pre-release

Full Changelog: v0.0.3...v0.0.4

升级candle 到 0.8.4
增加了 large-v3-turbo 模型支持，该模型可大幅改善推理速度
修复了数据库存储位置，之前错误的存储在了文档中，0.0.3及以前的更新至该版本后以前的配置将丢失（模型不会），请重新配置设置，建议删除用户文档下的 settings.hive、settings.lock

Assets 3

15 Mar 13:56

xkeyC

v0.0.3

5b02e1c

V0.0.3 Pre-release

Pre-release

What's Changed

feat: github runner build by @xkeyC in #2
Gh runner dev by @xkeyC in #4

New Contributors

@xkeyC made their first contribution in #2

Full Changelog: v0.0.2...v0.0.3

改进 Whisper 推理超时控制
实现 LLM 调用超时控制
更新依赖库
修复窗口关闭操作
支持 HF_ENDPOINT 环境变量

Contributors

xkeyC

Assets 3

Releases: xkeyC/fl_caption

V0.0.12

Uh oh!

V0.0.11

Uh oh!

V0.0.10

Uh oh!

V0.0.9

What's Changed

New Contributors

Contributors

Uh oh!

V0.0.8

Uh oh!

V0.0.7

What's Changed

Contributors

Uh oh!

V0.0.6

Uh oh!

V0.0.5

Uh oh!

V0.0.4

Uh oh!

V0.0.3

What's Changed

New Contributors

Contributors

Uh oh!