Technische Übersicht

Architektur, Kernfunktionen und unterstützte Formate

100 % lokal Semantische Suche 25+ Formate Team-Modus

Überblick

Windows-Desktop-Anwendung zur KI-gestützten, semantischen Suche in lokalen Dokumenten. Erkennt Zusammenhänge – findet Dateien auch ohne exakten Begriff.

Kernmerkmale

  • 100 % lokale Verarbeitung – keine Cloud
  • Ollama (Embeddings & LLM)
  • 25+ Dateiformate inkl. OCR
  • Team-Modus über Netzlaufwerk
  • 4 Lizenzstufen

Architektur

Views (WPF) → Manager → Core → OllamaSharp, Sqlite

Kernfunktionen

ScannerEngine

Streaming-Pipeline: Dateien sammeln → Text extrahieren → Embeddings erzeugen → in SQLite speichern. Fortschritt wird in klaren Phasen angezeigt.

TextExtractor

PDF (PdfPig + OCR bei Scan), Office (OpenXml), E-Mails (MsgReader), Bilder (Windows.Media.Ocr), CAD/BIM (Metadaten + IFilter/DXF-Text).

DocumentAnalyzer

KI-Chat mit Streaming und Quellen-Hervorhebung direkt in der Vorschau.

OllamaPriorityGate

Lange Prozesse laufen asynchron, damit Suche und Bedienung reaktionsschnell bleiben.

Unterstützte Dateitypen

Alle Formate werden nativ unterstützt. OCR für Bilder und gescannte PDFs – Qualität variiert je nach Scan.

PDF & Office

.pdf, .docx, .doc, .docm, .xlsx, .xls, .xlsb, .pptx, .ppt, .odt, .ods

E-Mail

.msg, .eml

Bilder (inkl. OCR)

.jpg, .png, .tiff, .bmp, .gif, .heic, .webp

CAD (Metadaten)

.dwg, .dxf, .rvt, .step, .ifc, .ipt, .sldprt, .3dm

Text & Markup

.txt, .rtf, .csv, .md, .json, .xml, .html, .yaml, .ini, .log

Grenzen & Erwartung

Entspricht dem Verhalten in der App (Windows.Media.Ocr, PdfPig, CadBimTextExtractor). Ausführliche Qualitätstabelle: Handbuch in der installierten App, Abschnitt Analyse.

OCR (Windows)

Gedruckter Text in Scans und Bildern; Sprache über Windows-Sprachpaket (optische Zeichenerkennung). Keine zuverlässige Handschriftenerkennung. Schlechte Kopien, schräge Fotos oder komplexe Layouts → lückenhafter Text → eingeschränkte Suche und KI-Antworten.

CAD/BIM

Im Index: immer Dateiname und voller Pfad (sehr gut per Suche auffindbar). Zusätzlich automatische Dateiinformationen (Größe, Änderungsdatum, bei DWG ASCII-Versionspräfix). Optional Text über Windows-IFilter oder DXF-Beschriftungen – kein Vision-Modell für Geometrie.

KI-Chat & Suche

Semantische Suche und Dokument-Chat arbeiten auf dem indexierten Text, nicht auf Rohbildern. Halluzinationen sind möglich – Originaldokument bleibt maßgeblich.

→ Kurzüberblick auf der Startseite

Lizenz & Gedächtnis

LizenzManager

LizenzLimitTeam LesenTeam Schreiben
Demo500
Basic10.000
Pro
ProTeam✓ + Domain

Lizenzierung ueber lokale Lizenzdaten, Hardware-ID und optionalen Online-Aktivierungsfluss.

GedaechtnisManager

Privat: AppData/privat.db

Team: gemeinsames Gedaechtnis ueber Netzwerkpfad mit Berechtigungen je Lizenzstufe.

Datenfluss

Scan: Ordner → TextExtractor → Embeddings → lokale Datenbank / Team-Gedaechtnis
Suche: Anfrage → semantische + klassische Bewertung → Trefferliste mit Relevanzsortierung

Systemvoraussetzungen

Windows 10 oder 11 (64 Bit). Ollama kann direkt aus der App installiert werden. Ausführliche Übersicht mit Minimal / Empfohlen / High-End:

→ Zur Systemvoraussetzungen auf der Startseite

Technische Details

VectorMath

Cosine-Similarity, Levenshtein für Fuzzy-Suche, Byte/Float-Konvertierung.

TextSanitizer

OCR-Korrekturen, typische Trennfehler und Verwechslungen.