event-dlq

Dead Letter Queue (DLQ) management package for the event pub-sub library.

Overview

This package provides dead-letter queue capabilities for handling messages that fail processing after all retry attempts. Key features include:

Message Storage: Persist failed messages with full error context
Filtering & Listing: Query DLQ messages by event, time, error, source, and retry status
Replay: Republish failed messages back to their original events
Cleanup: Remove old messages automatically or on-demand
Statistics: Monitor DLQ health with detailed metrics

Installation

go get github.com/rbaliyan/event-dlq

Store Implementations

Store	Use Case
`MemoryStore`	Testing and development
`PostgresStore`	Production with PostgreSQL
`MongoStore`	Production with MongoDB
`RedisStore`	Production with Redis

Usage

Basic Setup

import (
    "github.com/rbaliyan/event-dlq"
    "github.com/rbaliyan/event/v3/transport"
)

// Create a store (choose one based on your infrastructure)
store := dlq.NewMemoryStore()                    // For testing
// store := dlq.NewPostgresStore(db)             // For PostgreSQL
// store := dlq.NewMongoStore(mongoDatabase)     // For MongoDB
// store := dlq.NewRedisStore(redisClient)       // For Redis

// Create the manager with your transport
manager := dlq.NewManager(store, transport)

Storing Failed Messages

Store messages that have exhausted all retries:

func handleMessage(ctx context.Context, msg Message) error {
    for attempt := 0; attempt < maxRetries; attempt++ {
        if err := process(ctx, msg); err == nil {
            return nil // Success
        }
    }

    // All retries exhausted - send to DLQ
    return manager.Store(ctx, dlq.StoreParams{
        EventName:  "order.process",
        OriginalID: msg.ID,
        Payload:    msg.Payload,
        Metadata:   msg.Metadata,
        Err:        errors.New("max retries"),
        RetryCount: maxRetries,
        Source:     "order-service",
    })
}

Listing DLQ Messages

Query messages with flexible filtering:

// List all pending messages for a specific event
messages, err := manager.List(ctx, dlq.Filter{
    EventName:      "order.process",
    ExcludeRetried: true,
    Limit:          100,
})

// List messages from the last 24 hours
messages, err := manager.List(ctx, dlq.Filter{
    StartTime: time.Now().Add(-24 * time.Hour),
})

// List messages with specific error pattern
messages, err := manager.List(ctx, dlq.Filter{
    Error: "timeout",
    Limit: 50,
})

Retrieving a Single Message

msg, err := manager.Get(ctx, "dlq-message-id")
if err != nil {
    log.Fatal(err)
}
fmt.Printf("Event: %s, Error: %s, Retries: %d\n",
    msg.EventName, msg.Error, msg.RetryCount)

Counting Messages

// Count all messages
total, err := manager.Count(ctx, dlq.Filter{})

// Count pending messages for specific event
pending, err := manager.Count(ctx, dlq.Filter{
    EventName:      "payment.failed",
    ExcludeRetried: true,
})

Replaying Messages

Replay messages after fixing the underlying issue:

// Replay all unretried messages for an event
replayed, err := manager.Replay(ctx, dlq.Filter{
    EventName:      "order.process",
    ExcludeRetried: true,
})
fmt.Printf("Replayed %d messages\n", replayed)

// Replay a single message by ID
err := manager.ReplaySingle(ctx, "dlq-message-id")

Replayed messages include additional metadata:

dlq_replay: "true"
dlq_message_id: original DLQ message ID
dlq_original_error: the error that caused the original failure

Deleting Messages

// Delete a single message
err := manager.Delete(ctx, "dlq-message-id")

// Delete all messages matching a filter
deleted, err := manager.DeleteByFilter(ctx, dlq.Filter{
    EventName: "test.event",
})

Cleanup Old Messages

// Remove messages older than 30 days
deleted, err := manager.Cleanup(ctx, 30*24*time.Hour)
fmt.Printf("Cleaned up %d old messages\n", deleted)

Getting Statistics

stats, err := manager.Stats(ctx)
if err != nil {
    log.Fatal(err)
}

fmt.Printf("Total Messages: %d\n", stats.TotalMessages)
fmt.Printf("Pending: %d\n", stats.PendingMessages)
fmt.Printf("Retried: %d\n", stats.RetriedMessages)

for event, count := range stats.MessagesByEvent {
    fmt.Printf("  %s: %d\n", event, count)
}

Store-Specific Configuration

PostgreSQL

import "database/sql"

db, _ := sql.Open("postgres", connectionString)
store := dlq.NewPostgresStore(db).
    WithTable("custom_dlq_table") // Optional: custom table name

Required schema:

CREATE TABLE event_dlq (
    id          VARCHAR(36) PRIMARY KEY,
    event_name  VARCHAR(255) NOT NULL,
    original_id VARCHAR(36) NOT NULL,
    payload     BYTEA NOT NULL,
    metadata    JSONB,
    error       TEXT NOT NULL,
    retry_count INT NOT NULL DEFAULT 0,
    source      VARCHAR(255),
    created_at  TIMESTAMP NOT NULL DEFAULT NOW(),
    retried_at  TIMESTAMP
);

CREATE INDEX idx_dlq_event_name ON event_dlq(event_name);
CREATE INDEX idx_dlq_created_at ON event_dlq(created_at);
CREATE INDEX idx_dlq_retried_at ON event_dlq(retried_at) WHERE retried_at IS NULL;

MongoDB

import "go.mongodb.org/mongo-driver/mongo"

db := mongoClient.Database("myapp")
store := dlq.NewMongoStore(db).
    WithCollection("custom_dlq") // Optional: custom collection name

// Create indexes
err := store.EnsureIndexes(ctx)

// Optional: Create as capped collection for automatic cleanup
err := store.CreateCapped(ctx, 100*1024*1024, 50000) // 100MB, max 50k docs

Redis

import "github.com/redis/go-redis/v9"

client := redis.NewClient(&redis.Options{Addr: "localhost:6379"})
store := dlq.NewRedisStore(client).
    WithKeyPrefix("myapp:dlq:").  // Optional: custom key prefix
    WithMaxLen(100000)            // Optional: max stream length

Filter Options

Field	Description
`EventName`	Filter by event name (exact match)
`StartTime`	Filter messages created after this time
`EndTime`	Filter messages created before this time
`Error`	Filter by error message (contains match)
`MaxRetries`	Filter by maximum retry count
`Source`	Filter by source service
`ExcludeRetried`	Exclude already replayed messages
`Limit`	Maximum number of results
`Offset`	Pagination offset

Message Structure

type Message struct {
    ID         string            // Unique DLQ message ID
    EventName  string            // Original event name
    OriginalID string            // Original message ID
    Payload    []byte            // Message payload
    Metadata   map[string]string // Message metadata
    Error      string            // Error description
    RetryCount int               // Retries attempted
    CreatedAt  time.Time         // When added to DLQ
    RetriedAt  *time.Time        // When replayed (nil if never)
    Source     string            // Source service
}

Best Practices

Store before exhausting retries: Add messages to DLQ after a reasonable number of retries
Include context: Add source service and meaningful metadata for debugging
Monitor DLQ size: Set up alerts when DLQ grows unexpectedly
Regular cleanup: Schedule periodic cleanup of old messages
Automated replay: Consider automated replay for recoverable errors after fixes are deployed

Examples

See the examples/ directory for a complete at-least-once delivery example that demonstrates:

Transactional outbox pattern for atomic database writes with event publishing
Resume tokens for crash recovery
Ack store for tracking acknowledged events
DLQ integration for handling permanent failures
Worker groups for load-balanced message processing
Background DLQ maintenance (cleanup and stats)

Run the example with MongoDB (requires replica set):

cd examples
go run main.go

License

MIT License - see LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 104 Commits
.clusterfuzzlite		.clusterfuzzlite
.github		.github
examples		examples
scripts		scripts
.gitignore		.gitignore
.golangci.yml		.golangci.yml
.mise.toml		.mise.toml
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md
adapter.go		adapter.go
benchmark_test.go		benchmark_test.go
dlq_test.go		dlq_test.go
fuzz_deps_test.go		fuzz_deps_test.go
fuzz_test.go		fuzz_test.go
go.mod		go.mod
go.sum		go.sum
integration_test.go		integration_test.go
justfile		justfile
manager.go		manager.go
memory.go		memory.go
metrics.go		metrics.go
mongodb.go		mongodb.go
postgres.go		postgres.go
redis.go		redis.go
redis_test.go		redis_test.go
store.go		store.go

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

event-dlq

Overview

Installation

Store Implementations

Usage

Basic Setup

Storing Failed Messages

Listing DLQ Messages

Retrieving a Single Message

Counting Messages

Replaying Messages

Deleting Messages

Cleanup Old Messages

Getting Statistics

Store-Specific Configuration

PostgreSQL

MongoDB

Redis

Filter Options

Message Structure

Best Practices

Examples

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

event-dlq

Overview

Installation

Store Implementations

Usage

Basic Setup

Storing Failed Messages

Listing DLQ Messages

Retrieving a Single Message

Counting Messages

Replaying Messages

Deleting Messages

Cleanup Old Messages

Getting Statistics

Store-Specific Configuration

PostgreSQL

MongoDB

Redis

Filter Options

Message Structure

Best Practices

Examples

License

About

Resources

License

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages