brief

Document-OCR toolkit: convert PDFs to layout-true text.

Two rendering paths, same output:

pdfminer — fast, perfect, for digital PDFs with embedded text:

.venv/bin/pdf2txt.py -t xml file.pdf | ./xml2txt

Tesseract — for scanned/image-based PDFs:

./pdf2txt file.pdf

Install

git clone <repo>
cd brief
uv sync

System dependencies for the Tesseract path: pdftocairo, tesseract (with deu), parallel.

Commands

OCR:

Tool	Input	Output	Use case
`xml2txt`	pdfminer XML (stdin/file)	layout-true text	Digital PDFs, instant
`pdf2txt`	PDF file	layout-true text	Scanned PDFs via OCR
`pdf2tsv.sh`	PDF file	Tesseract TSV cache	Bulk OCR, reuse results

Briefversand:

Tool
`lxp send file.pdf`	Brief via LetterXpress versenden
`lxp balance`	Guthaben abrufen
`lxp jobs`	Aufträge auflisten
`lxp status <id>`	Status eines Auftrags
`lxp cancel <id>`	Auftrag stornieren
`lxp price --pages 2`	Preis berechnen

Auth aus .env (LETTERXPRESS_USERNAME, LETTERXPRESS_MODE) und .secret.lxp (API-Key).

Skills

OpenCode skills in skills/:

dokument-ocr — Full OCR pipeline documentation
brief-scannen — Brother ADF scanner instructions

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.claude		.claude
.opencode		.opencode
skills		skills
src		src
.env.example		.env.example
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
lxp		lxp
pdf2tsv.sh		pdf2tsv.sh
pdf2txt		pdf2txt
pyproject.toml		pyproject.toml
uv.lock		uv.lock
xml2txt		xml2txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

brief

Install

Commands

Skills

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

brief

Install

Commands

Skills

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages