Scanimage

Dieses Script holt ein ein- oder mehrseitiges Dokument vom Scanner und speichert es in “dest” (Die Personalien des Patienten als nachname_vorname_gebdat sind in $1, der Titel des Dokuments in $2):

#! /bin/bash
# Usage: ./scan.sh <directory> <filename>
# Das Verzeichnis des Servers muss bereits gemounted sein.
dest=/mnt/Berichte/$1

# Sicherstellen, dass wir uns in einem leeren Verzeichnis befinden.
rm -rf scandir
mkdir scandir
cd scandir

# Die Optionen sind Scannerspezifisch. Wir holen eine bis "beliebig" viele
# Seiten vom Document Feeder, Scannen sie doppelseitig und speichern sie
# als out?.tif -Dateien
scanimage --source="ADF Duplex" --batch --format=tiff

# Alle Seiten zu einer einzelnen tiff-Datei zusammenhängen
convert \*.tif composite.tiff

# Das OCR-Programm mit Voreinstellung "deutsch" laufen lassen
tesseract -l deu composite.tiff output pdf

# Die erstellte PDF Datei ins Lucinda-Verzeichnis verschieben.
mkdir -p $dest
mv output.pdf ${dest}/$2

Dieses Script läuft nur auf Linux und braucht Sane, ImageMagick, Tesseract, tesseract-deutsch. Es kann verwendet werden, um Dokumente für Lucinda einzuscannen und mit OCR durchsuchbar zu machen. Das Lucinda Verzeichnis muss in diesem Beispiel unter /mnt/Berichte gemountet sein.