README: Voraussetzungen aktualisiert (CUDA-GPU, ESP32-CAM, MQTT)

- NVIDIA-GPU mit CUDA als Voraussetzung dokumentiert (FP16, CPU-Fallback) - ESP32-CAM als MJPEG-Live-Quelle inkl. CAMERA_URL/Fan-out/Always-on - MQTT-Broker fuer Crossing-Events (Topic, Payload, Env-Konfig) - Installation um CUDA-PyTorch, requests und paho-mqtt ergaenzt Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-01 14:16:54 +02:00
parent c09fd8948b
commit b447d3e7c5
1 changed files with 94 additions and 3 deletions
--- a/README.md
+++ b/README.md
@@ -15,19 +15,35 @@ Eine webbasierte Anwendung zur Echtzeit-Objekterkennung und -Verfolgung mittels
 ## Voraussetzungen

 - Python 3.12 oder höher
- Webcam (für Live-Erkennung)
+- **NVIDIA-Grafikkarte mit CUDA-Unterstützung** – für die Echtzeit-Erkennung erforderlich (siehe [Hardware & CUDA](#hardware--cuda))
+- **ESP32-CAM** als Live-Quelle, die einen MJPEG-Stream im Netzwerk bereitstellt (siehe [Kamera / Livestream (ESP32-CAM)](#kamera--livestream-esp32-cam))
+- **MQTT-Broker** zum Empfang der Zähl-Events (z. B. [Mosquitto](https://mosquitto.org/); siehe [MQTT / Zähl-Events](#mqtt--zähl-events))
 - YOLO-Modell (`yolo11s.pt`) im Hauptverzeichnis

+> ⚠️ **Wichtig:** Für die flüssige Live-Erkennung wird eine **NVIDIA-GPU mit CUDA** benötigt. Ohne CUDA läuft die Inferenz auf der CPU und ist für Echtzeit-Streams zu langsam.
+
 ## Installation

 1. Repository klonen oder herunterladen

 2. Erforderliche Python-Pakete installieren:
 ```bash
-pip3 install flask opencv-python numpy ultralytics
+pip3 install flask opencv-python numpy ultralytics requests paho-mqtt
 ```

-3. Sicherstellen, dass die Modelldatei `yolo11s.pt` im Hauptverzeichnis vorhanden ist
+3. **CUDA-fähiges PyTorch installieren** (für GPU-Beschleunigung). Die passende
+   Variante richtet sich nach der installierten CUDA-Version, z. B. für CUDA 12.x:
+```bash
+pip3 install torch --index-url https://download.pytorch.org/whl/cu121
+```
+   Prüfen, ob die GPU erkannt wird:
+```bash
+python3 -c "import torch; print(torch.cuda.is_available())"
+```
+   Gibt der Befehl `True` aus, wird die NVIDIA-GPU genutzt und FP16-Inferenz
+   automatisch aktiviert.
+
+4. Sicherstellen, dass die Modelldatei `yolo11s.pt` im Hauptverzeichnis vorhanden ist

 ## Verwendung

@@ -69,6 +85,81 @@ Die Anwendung ist dann unter `http://localhost:8080` erreichbar.

 ## Technische Details

+### Kamera / Livestream (ESP32-CAM)
+
+In diesem Beispiel dient eine **ESP32-CAM** als Live-Quelle. Sie stellt einen
+**MJPEG-Stream** im Netzwerk bereit, den die Anwendung abgreift, mit YOLO
+auswertet und an die Browser-Viewer weiterverteilt.
+
+- Die Stream-Adresse wird über die Umgebungsvariable `CAMERA_URL` gesetzt.
+  Standard ist die typische ESP32-CAM-Adresse (Port `81`, Pfad `/stream`):
+  ```bash
+  export CAMERA_URL="http://CAMERA-IP:81/stream"
+  ```
+- Es wird **eine einzige Verbindung** zur ESP32-CAM aufgebaut und das Bild an
+  beliebig viele Zuschauer verteilt (Fan-out). So wird der begrenzte
+  Stream-Slot der ESP32-CAM nicht durch jeden Browser blockiert.
+- Mit `GRABBER_ALWAYS_ON=1` läuft der Grabber rund um die Uhr und zählt auch
+  dann, wenn niemand zuschaut. Bei `0` (Standard) verbindet er sich nur, solange
+  ein Browser den Stream betrachtet – das gibt den ESP32-Slot wieder frei.
+
+> 💡 Statt einer ESP32-CAM kann über `CAMERA_URL` auch jede andere MJPEG-/HTTP-
+> Stream-Quelle eingebunden werden.
+
+### MQTT / Zähl-Events
+
+Jede erkannte Linienüberquerung wird als **MQTT-Event** veröffentlicht. Dafür
+wird ein **MQTT-Broker** benötigt (z. B. [Mosquitto](https://mosquitto.org/)).
+So lassen sich die Zähldaten z. B. über **n8n** weiterverarbeiten und in einer
+Datenbank wie **NocoDB** ablegen.
+
+- Die Events werden auf dem Topic `{MQTT_TOPIC}/crossing` mit **QoS 1**
+  (nicht retained) publiziert.
+- Das Payload ist JSON, z. B.:
+  ```json
+  {
+    "event": "crossing",
+    "camera": "cam1",
+    "source": "webcam",
+    "type": "car",
+    "track_id": 42,
+    "ts": "2026-06-01T12:34:56+02:00"
+  }
+  ```
+- Konfiguriert wird der Broker über Umgebungsvariablen:
+
+  | Variable     | Standard               | Beschreibung                         |
+  | ------------ | ---------------------- | ------------------------------------ |
+  | `MQTT_HOST`  | `127.0.0.1`            | Adresse des MQTT-Brokers             |
+  | `MQTT_PORT`  | `1883`                 | Broker-Port                          |
+  | `MQTT_USER`  | –                      | Benutzername (optional)              |
+  | `MQTT_PASS`  | –                      | Passwort (optional)                  |
+  | `MQTT_TOPIC` | `vehiclecounter/cam1`  | Basis-Topic der Events               |
+  | `CAMERA_ID`  | `cam1`                 | Kamera-Kennung im Payload            |
+
+> ℹ️ Die Verbindung zum Broker erfolgt asynchron. Ist der Broker nicht
+> erreichbar, startet die Anwendung trotzdem – es werden dann lediglich keine
+> Events übertragen.
+
+### Hardware & CUDA
+
+Die Objekterkennung mit YOLOv11 ist rechenintensiv. Für die Echtzeit-Verarbeitung
+von Live-Streams wird daher eine **NVIDIA-Grafikkarte mit CUDA** benötigt.
+
+- **Mit NVIDIA-GPU (CUDA):** Die Inferenz läuft auf der Grafikkarte. Erkennt die
+  Anwendung eine CUDA-fähige GPU, wird automatisch **FP16-Inferenz** aktiviert
+  (per `YOLO_HALF` überschreibbar) – das halbiert den Speicherbedarf und erhöht
+  die Bildrate spürbar.
+- **Ohne GPU (nur CPU):** Die Anwendung startet zwar, die Inferenz ist für
+  Live-Streams jedoch zu langsam. Ein zusätzliches **Motion-Gate** sorgt dafür,
+  dass YOLO nur bei tatsächlicher Bewegung im Bild ausgeführt wird, was die Last
+  reduziert – ersetzt eine GPU aber nicht.
+
+Voraussetzungen für die GPU-Nutzung:
+
+- NVIDIA-Treiber + passende CUDA-Runtime
+- CUDA-fähiges PyTorch (siehe [Installation](#installation))
+
 ### Verwendete Technologien

 - **Flask**: Web-Framework für Routing und Template-Rendering