Streaming-Pipeline: Dateien sammeln → Text extrahieren → Embeddings erzeugen → in SQLite speichern. Fortschritt wird in klaren Phasen angezeigt.
Technische Übersicht
Architektur, Kernfunktionen und unterstützte Formate
Überblick
Windows-Desktop-Anwendung zur KI-gestützten, semantischen Suche in lokalen Dokumenten. Erkennt Zusammenhänge – findet Dateien auch ohne exakten Begriff.
Kernmerkmale
- 100 % lokale Verarbeitung – keine Cloud
- Ollama (Embeddings & LLM)
- 25+ Dateiformate inkl. OCR
- Team-Modus über Netzlaufwerk
- 4 Lizenzstufen
Architektur
Views (WPF) → Manager → Core → OllamaSharp, Sqlite
Kernfunktionen
Semantische und klassische Suche über Privat- und Team-Gedächtnis. Die Relevanz basiert auf mehreren Signalen und wird mit Filtern kombiniert.
Dateisuche im Detail
Trefferarten
Dateiname, Pfad, extrahierter Inhalt und semantische Aehnlichkeit werden zusammen ausgewertet.
Filter & Steuerung
Je nach Suchmodus koennen Dateitypen und weitere Kriterien beruecksichtigt werden.
Ergebnis
Treffer werden nach Relevanz sortiert und koennen direkt in der Vorschau weitergeprueft werden.
PDF (PdfPig + OCR bei Scan), Office (OpenXml), E-Mails (MsgReader), Bilder (Windows.Media.Ocr), CAD/BIM (Metadaten + IFilter/DXF-Text).
KI-Chat mit Streaming und Quellen-Hervorhebung direkt in der Vorschau.
Lange Prozesse laufen asynchron, damit Suche und Bedienung reaktionsschnell bleiben.
Unterstützte Dateitypen
Alle Formate werden nativ unterstützt. OCR für Bilder und gescannte PDFs – Qualität variiert je nach Scan.
PDF & Office
.pdf, .docx, .doc, .docm, .xlsx, .xls, .xlsb, .pptx, .ppt, .odt, .ods
.msg, .eml
Bilder (inkl. OCR)
.jpg, .png, .tiff, .bmp, .gif, .heic, .webp
CAD (Metadaten)
.dwg, .dxf, .rvt, .step, .ifc, .ipt, .sldprt, .3dm
Text & Markup
.txt, .rtf, .csv, .md, .json, .xml, .html, .yaml, .ini, .log
Grenzen & Erwartung
Entspricht dem Verhalten in der App (Windows.Media.Ocr, PdfPig, CadBimTextExtractor). Ausführliche Qualitätstabelle: Handbuch in der installierten App, Abschnitt Analyse.
OCR (Windows)
Gedruckter Text in Scans und Bildern; Sprache über Windows-Sprachpaket (optische Zeichenerkennung). Keine zuverlässige Handschriftenerkennung. Schlechte Kopien, schräge Fotos oder komplexe Layouts → lückenhafter Text → eingeschränkte Suche und KI-Antworten.
CAD/BIM
Im Index: immer Dateiname und voller Pfad (sehr gut per Suche auffindbar). Zusätzlich automatische Dateiinformationen (Größe, Änderungsdatum, bei DWG ASCII-Versionspräfix). Optional Text über Windows-IFilter oder DXF-Beschriftungen – kein Vision-Modell für Geometrie.
KI-Chat & Suche
Semantische Suche und Dokument-Chat arbeiten auf dem indexierten Text, nicht auf Rohbildern. Halluzinationen sind möglich – Originaldokument bleibt maßgeblich.
Lizenz & Gedächtnis
LizenzManager
| Lizenz | Limit | Team Lesen | Team Schreiben |
|---|---|---|---|
| Demo | 500 | — | — |
| Basic | 10.000 | ✓ | — |
| Pro | ∞ | ✓ | ✓ |
| ProTeam | ∞ | ✓ | ✓ + Domain |
Lizenzierung ueber lokale Lizenzdaten, Hardware-ID und optionalen Online-Aktivierungsfluss.
GedaechtnisManager
Privat: AppData/privat.db
Team: gemeinsames Gedaechtnis ueber Netzwerkpfad mit Berechtigungen je Lizenzstufe.
Datenfluss
Systemvoraussetzungen
Windows 10 oder 11 (64 Bit). Ollama kann direkt aus der App installiert werden. Ausführliche Übersicht mit Minimal / Empfohlen / High-End:
Technische Details
VectorMath
Cosine-Similarity, Levenshtein für Fuzzy-Suche, Byte/Float-Konvertierung.
TextSanitizer
OCR-Korrekturen, typische Trennfehler und Verwechslungen.