Generischer Report Generator mit MCP-Integration

Generische Dokumenten-Pipeline für DOCX/PDF: JSON + Templates, Web-UI, Docker-Setup und MCP-Server für die Integration in KI-Workflows.

Generischer Report Generator mit MCP-Integration

Nach der ersten PoC-Version des Report Generators bringt Release 0.2.0 eine fundamentale Weiterentwicklung: Aus der spezifischen Lösung des PoC wurde ein generischer Report-Generator, der flexibel mit beliebigen JSON-Daten und DOCX-Templates arbeitet. Die neue Version macht die Dokumentenerstellung nicht nur einfacher, sondern auch sicherer und vielseitiger einsetzbar.

Was ist neu in v0.2.0?

Die wichtigsten Neuerungen im Überblick:

Generische Dokumenten-Pipeline

Der größte Wandel: Die Pipeline ist jetzt vollständig generisch und nicht mehr auf spezifische Datenstrukturen beschränkt. Jedes DOCX-Template kann mit passenden JSON-Daten kombiniert werden, um individuelle Dokumente zu erstellen. Das macht die Lösung flexibel für verschiedene Anwendungsfälle:

  1. Business-Reports: Standard-Geschäftsberichte mit firmenspezifischen Templates
  2. Dokumentation: Automatische Generierung von technischer Dokumentation
  3. Rechnungen und Angebote: Standardisierte Geschäftsdokumente
  4. Zertifikate und Bescheinigungen: Individuelle Dokumente aus Templates

Bereitstellung als Docker-Container

Die Containerisierung macht die Bereitstellung des Report Generators besonders einfach: Mit einem einzigen docker-compose up stehen sowohl die Web-UI als auch der MCP-Server sofort zur Verfügung. Das ermöglicht eine flexible lokale Nutzung – ob für schnelle Tests über die Browser-Oberfläche oder für die Integration in verschiedene MCP-fähige Tools wie Cursor, Claude Desktop oder andere KI-Assistenten. Keine komplexe Installation, keine Abhängigkeitsprobleme – einfach starten und loslegen.

curl -L -o compose.yml https://raw.githubusercontent.com/mmrotzek/demo-professional-docx-pdf-report-poi-tl/refs/heads/main/compose.prod.yml
docker compose up

» http://localhost:8080/ui/reports

MCP-Server Integration

Ein Highlight der neuen Version ist die Integration eines MCP-Servers (Model Context Protocol). Der Server ist über HTTP unter /mcp/message erreichbar und bietet folgende Tools:

  • generate_report: Erzeugt Reports aus Templates und JSON-Daten
  • provide_template: Ermöglicht das Bereitstellen neuer Templates
  • list_templates: Listet verfügbare Templates auf

Zusätzlich werden Template-, Schema- und Sample-Ressourcen als MCP-Ressourcen bereitgestellt, was eine nahtlose Integration in MCP-fähige Anwendungen ermöglicht.

Kurz: Was ist das Model Context Protocol?
Das Model Context Protocol (MCP) ist ein offener Standard, mit dem KI-Anwendungen einheitlich auf externe Datenquellen und Tools zugreifen. Anthropic hat MCP im November 2024 eingeführt – oft als „USB-C für KI“ beschrieben: Statt vieler proprietärer Integrationen gibt es ein gemeinsames Protokoll. MCP-Server bieten Tools (vom Modell aufrufbare Funktionen) und Resources (Kontextdaten wie Templates oder Schemas). Genau das nutzt der Report Generator: Die genannten Tools und Ressourcen folgen der MCP-Spezifikation und sind damit direkt mit Cursor, Claude Desktop und anderen MCP-fähigen Umgebungen kompatibel.

Neue Web-UI für Report-Erstellung

Eine komplett neue, server-seitig gerenderte Web-Oberfläche unter /ui/reports macht die Erstellung von Reports noch einfacher. Die UI bietet eine intuitive Bedienung für alle Nutzer – auch ohne technische Vorkenntnisse:

  • Template-Upload: Templates können direkt über die UI hochgeladen werden
  • Sample JSON: Vordefinierte JSON-Beispiele für schnelle Tests und zum Verständnis der Datenstruktur
  • Live-Vorschau: Reports können direkt in der UI generiert und angezeigt werden
  • Download-Optionen: Flexible Ausgabe als DOCX oder PDF

Sicherheitshärtung

Ein wichtiger Fokus lag auf der Verbesserung der Sicherheit:

  • POI Zip-Bomb Limits: Schutz vor komprimierten Angriffen
  • Base64 DOCX-Validierung: Sicherstellung der Dokumentenintegrität
  • Classpath Allowlist: Kontrollierte Ressourcenzugriffe
  • Canonical Path Checks: Verhinderung von Path-Traversal-Angriffen
  • Size/TTL Limits: Begrenzung für temporäre Templates

Plattform-Upgrades

Die technische Basis wurde auf den neuesten Stand gebracht.

Containerisierung und CI/CD

Die Deployment-Prozesse wurden professionalisiert und automatisiert:

  • Hardened Dockerfile: Sicherheitsoptimierte Container-Images mit minimaler Angriffsfläche
  • Docker Compose: Separate Konfigurationen für Development und Production-Umgebungen
  • GitHub Actions: Automatisierte Build- und Push-Prozesse für Multi-Arch-Images (AMD64, ARM64)

Fazit

Mit Version 0.2.0 hat sich der Report Generator von einem Proof-of-Concept zu einer produktionsreifen, generischen Dokumenten-Pipeline entwickelt. Die Kombination aus MCP-Integration, benutzerfreundlicher Web-UI und einfacher Docker-Bereitstellung macht die Lösung sowohl für Entwickler als auch für Endnutzer attraktiv. Besonders die nahtlose Einbindung in moderne KI-Workflows über MCP eröffnet spannende Möglichkeiten für automatisierte Dokumentenerstellung. Wer professionelle Reports aus Word-Templates erstellen möchte, findet hier eine flexible und sichere Lösung, die sich einfach in bestehende Prozesse integrieren lässt.

Weitere Informationen: