Eigenständige Bewegungserkennung ist eine der Stärken moderner Netzwerkkameras und Überwachungslösungen. Doch die Anforderungen steigen: Es geht längst nicht mehr nur um den Einbrecher oder Ladendieb. Auch herrenlose Koffer am Bahnsteig oder im Flughafen sollen automatisch detektiert werden. Für eine entsprechend intelligente Videoanalyse hat Sony mit DEPA eine Architektur entwickelt, die sich auf Hardware und Software verteilt. Der Beitrag analysiert das Konzept in Theorie und Praxis.
Videobewegungserkennung (Motion Detection) zählt zu den "Königsdisziplinen" von
Videoüberwachungslösungen. Zum einen liegt es mehr als nahe, Veränderungen im Livebild für eine
vollautomatische Alarmierung oder Bildaufzeichnung heranzuziehen. Zum anderen kann diese Technik in
vielen – wenn auch nicht allen – Fällen aufwändigere Alarmsensorik wie beispielsweise
Bewegungsmelder, Lichtschranken, Türkontakte oder akustische Sensoren ersetzen. Allerdings setzt
Videobewegungserkennung Bildanalyse und damit Rechenleistung voraus. Somit ist dies eine klassisch
Domäne von PC- und netzwerkbasierenden Monitoring- und Recording-Lösungen. Insbesondere bei
Zuschaltung herkömmlicher analoger Kamerasysteme ohne eigene Rechenintelligenz bleibt nur dieser
Weg. Netzwerkkameras hingegen verfügen ohnehin über Rechenkapazität, um Videobewegungserkennung
gegebenenfalls auch gleich vor Ort erledigen zu können.
Der Vorteil einer integrierten Videobewegungserkennung liegt unter anderem in der optimierten
und verlustfreien Bildanalyse unmittelbar am Entstehungsort. Der auszuwertende Bilddatenstrom
braucht – jedenfalls für diesen Zweck – nicht erst auf ein anderes System übertragen zu werden, und
die Kamera ist im Idealfall als Überwachungslösung autark und von zusätzlicher Monitoring-Software
unabhängig. Ein gewisser Nachteil integrierter Lösungen ist beispielsweise die Festlegung auf die
von der Kamera beziehungsweise ihrer Firmware angebotenen Erkennungstechniken und Algorithmen.
Motion-Detection ist dabei für den Anwender in der Regel das schwierigste Kapitel der
Kamerakonfiguration – bei oft unbefriedigender Treffsicherheit.
So gerät die typische Einrichtung von gut platzierten Überwachungsfenstern und die
Feinjustierung von Sensibilitätsparametern leicht zu einer Wissenschaft für sich. Der Grat zwischen
zu häufigen Fehlalarmen und mangelhafter Erkennung ist oft sehr eng. Leicht zu stören ist
klassische Videobewegungserkennung beispielsweise durch zufällige Veränderungen der
Umgebungshelligkeit (Licht und Schatten), durch Bewegungen in der Natur (zum Beispiel Blätter im
Wind) oder etwa durch das technisch bedingte Bildrauschen bei geringer Helligkeit.
Einen grundsätzlich neuen Ansatz zur Lösung der aufgezeigten Probleme hat inzwischen Sony
realisiert. Das Stichwort heißt dort "intelligente Videoanalyse" und klingt etwas vollmundig – die
Technik dahinter kann sich aber sehen lassen. Eng verbunden ist diese mit der Anfang des Jahres von
Sony vorgestellten "Distributed Enhanced Processing Architecture" (DEPA). Der Hersteller setzt
dabei an mehreren Stellen an: zum einen direkt auf der Hardware im Rahmen einer neuen "
intelligenten" Kamerageneration und zum anderen über eine Aufgabenteilung zwischen Kamera und
optionaler nachgeschalteter Überwachungssoftware.
Der entscheidende Punkt auf den Kameras ist der Schritt von der traditionellen
Bewegungserkennung hin zu einer Objekterkennung. Eine solche Kamera registriert eben nicht nur
Bewegung in der Szenerie oder einem überwachten Bildausschnitt, sondern ordnet diese selbstständig
bewegten Objekten zu. Dabei kann es sich beispielsweise um Personen oder Fahrzeuge handeln. Erkennt
die Kamera eine Bewegung als "Objekt", so kann sie diesem auch eine interne Kennung zuordnen und
das Objekt in seiner weiteren Bewegung verfolgen. Damit erhält das Objekt auch Eigenschaften wie
Bewegungsrichtung, Geschwindigkeit oder Größe. Zudem separiert die Objekterkennung relativ
treffsicher zufällige "natürliche" von tatsächlich überwachungsrelevanten Bewegungen. Technischer
Hintergrund ist ein vektororientiertes Analyseverfahren von Sony, das bis zu 15 Vollbilder direkt
in der Kamera vergleicht. Die herkömmliche Bewegungserkennung basiert hingegen in der Regel auf den
Veränderungen zwischen lediglich zwei aufeinander folgenden Vollbildern.
Zusätzlich existiert im Rahmen der Objekterkennung noch eine spezielle Variante, die sich nicht
mit bewegenden Objekten, sondern mit stehen gebliebenen oder verschwundenen Objekten befasst. Dazu
ist jeweils eine gewisse "Trainingszeit" (standardmäßig 40 Sekunden) nötig, in der die Kamera die
unveränderlichen Komponenten der Szenerie festlegt. Anschließende markante Änderungen signalisieren
dann ein zusätzliches oder verschwundenes Objekt. Die Methode eignet sich prinzipiell
beispielsweise zur Detektierung von herrenlosen Gepäckstücken oder entwendeten
Ausstellungsgegenständen.
Die Objekterkennung stellt allerdings nur eine Komponente von DEPA dar. In rudimentärem Umfang
lässt sie sich zwar direkt auf der Kamera zur Ereignisauslösung nutzen – beispielsweise für dort
konfigurierte Bildaufzeichnungen, FTP-Übertragungen oder E-Mail-Benachrichtigungen. Der eigentliche
Clou ist allerdings das Zusammenspiel aus Kamera und externer DEPA-fähiger Uberwachungssoftware wie
dem Sony Realshot Manager (RSM) ab Version 4.0. Im Rahmen dieser verteilten Architektur übernimmt
die Kamera bei der Objekterkennung die Vorverarbeitung, die Nachverarbeitung erfolgt in Echtzeit in
der auf einem PC laufenden Softwarelösung. Dort bietet sich dann die Möglichkeit, sehr viel
differenziertere Analysen (zum Beispiel Bewegungsrichtung) vorzunehmen, als dies auf der Kamera
selbst der Fall wäre. Der Nutzen der Vorverarbeitung kommt dabei voll zum Tragen: Die Kamera
überträgt die grundlegenden Objektinformationen in kompakter Form als so genannte Metadaten an das
Auswertungssystem. Diese Übertragung erfolgt zusätzlich zum Bilddatenstrom auf dem HTTP-Kanal. Die
Auswertungssoftware stützt sich bei der Analyse ausschließlich auf die Metadaten, die eigentlichen
Bilddaten dienen lediglich dem Monitoring und gegebenenfalls dem Recording.
Im Vergleich zu konventioneller Videoüberwachungssoftware sind folgende grundsätzliche Vorteile
auszumachen: Die Vorverarbeitung in der Kamera entlastet das Analysesystem, das in der Regel auch
noch Daten anderer Kameras zeitgleich verarbeiten muss (Skalierbarkeit). Die
Bewegungs-/Objektanalyse ist zudem unabhängig von Qualität, Auflösung oder Übertragungsrate der
übertragenen Bilddaten (Bandbreite, Netzwerklast). Und noch ein weiterer Aspekt kommt hinzu: Die
Metadaten bleiben auch bei einer Videoaufzeichnung, wie sie der RSM vornimmt, erhalten. Dies bietet
prinzipiell die Möglichkeit, Aufzeichnungen auch nachträglich und gegebenenfalls mit geänderten
Vorgaben zu analysieren. So lassen sich beispielsweise auch Daueraufzeichnungen nutzen, um sie
später nach unterschiedlichen Kriterien (zum Beispiel Bewegungsmuster) und mit vergleichsweise
geringem Aufwand zu analysieren.
Soweit die Theorie. Wie sich die Möglichkeiten rund um Bewegungs- und Objekterkennung in der
Praxis darstellen, hat LANline in einer Testinstallation erkundet. Aus dem Portfolio "intelligenter"
Sony-Kameras stand hierfür das Modell SNC-DF50P zur Verfügung sowie eine Testlizenz für den Sony
RSM (Verion 4.2.0.10). Die wesentlichen Aspekte der Objekterkennung und des DEPA-Konzepts sollten
sich so überprüfen lassen, wenn auch der Realshot Manager mit lediglich einer angeschlossenen
Kamera vom Anspruch her unterfordert ist.
Die SNC-DF50P (Preis 1150 Euro) läuft bei Sony unter dem Oberbegriff "MiniDome-Kamera". Die
Innenraumkuppelkamera ist für die Decken- oder Wandinstallation konzipiert, das Variobjektiv
(Weitwinkel bis Tele) lässt sich bei der Montage in der gewünschten Richtung und mit der passenden
Brennweite justieren und fixieren. Die Stromversorgung kann – wie im Test – über Power over
Ethernet (PoE) erfolgen. Der Standardzugriff für Monitoring und Administration erfolgt über den
Webbrower (Internet Explorer). Die Kamera wartet mit einer Reihe von Features auf, die für eine
Überwachungskamera in dieser Preisklasse angemessen erscheinen: Neben unterschiedlichen Codecs wie
(Motion-)JPEG, MPEG4 und H.264 – die ersten beiden auch gleichzeitig – bietet die Kamera zudem
Multicast-Streaming, einen elektronischen Schwingungsstabilisator, bidirektionale
Audiounterstützung über externe Anschlüsse, Sensorein- und Alarmausgänge sowie einen internen
16-MByte-RAM-Speicher für Alarmaufzeichnungen, der von außen via FTP zugänglich ist. Zu weiteren
Features zählen E-Mail-Notifikationen und FTP-Bild-Uploads sowie Voice-Alerts. Im Bereich Security
stehen Benutzerverwaltung, 802.1X-Authentifizierung, IP-Adressfilter sowie "Privacy-Zone-Masking"
zur Verfügung.
Insgesamt erweist sich die SNC-DF50P im Test als grundsolide professionelle Kamera, die die
geforderten Aufgaben anstandslos erfüllt und weder bei der Installation noch bei der Administration
große Probleme bereitet. Dennoch wirkt die Kamera etwas spröde. Verzichtet hat Sony auf alles, was
im weitesten Sinne als "Schnickschnack" bezeichnet werden könnte: So vermisst der Anwender
beispielsweise erweiterte Möglichkeiten für Texteinblendungen, dynamische Pfadadressierungen bei
FTP-Uploads oder eine nennenswerte Onlinehilfe. Auch das umfangreiche (deutsche) Handbuch hat eher
Referenzcharakter. Dem System ist anzumerken, dass hier weniger der Stand-alone-Betrieb im
Vordergrund steht, sondern dass diese Art von Kameras typischerweise im Verbund mit weiteren im
Rahmen übergeordneter Überwachungslösungen betrieben werden.
So wundert es auch nicht, dass das hier interessierende Feature "Object Detection" im Rahmen der
Kamera selbst nur rudimentär angelegt ist. Der Anwender lernt die zwei – wesentlich
unterschiedlichen – Methoden "Moving Object" beziehungsweise "Unattended Object" kennen, die sich
hier wie auch über den RSM nicht gleichzeitig nutzen lassen. Die grundlegende Funktionstüchtigkeit
der Objekterkennung ist jedoch auch ohne Realshot Manager (der die Kamera über ihr HTTP-API
konfiguriert) nutzbar und durchaus überzeugend. Der Vorteil gegenüber konventioneller
Videobewegungserkennung macht sich durch einfache Handhabung und Treffsicherheit bemerkbar.
Der RSM ist eine Windows-basierende Mehrgeräte-Überwachungssoftware für Sony-Kameras mit den
Hauptaufgaben Monitoring, Alarmierung, Aktionsauslösung und Bildaufzeichnung. Er lässt sich sowohl
stand-alone betreiben (im Test) als auch in einer Client-Server-Kombination. Eine Besprechung des
gesamten Tools würde hier bei weitem den Rahmen sprengen, sodass nur auf den kleinen Teilaspekt der
Objekterkennung über Metadaten im Rahmen von DEPA eingegangen werden kann. Auch bei RSM hat das
Handbuch eher Referenzcharakter – von den über 200 Seiten beziehen sich maximal zehn auf das Thema
Bewegungserkennung und die in diesem Fall zuständigen "Video Motion Filter" (VMF). Diese lassen
sich kombinieren und zu "Paketen" schnüren. Allerdings gilt auch hier – wie schon auf der Kamera –
die strikte Trennung zwischen dem Typus "Beweglich" (Moving Object) und "Stehen geblieben"
(Unattended Object). Beide Paket-/Filtertypen sind im gleichzeitigen Betrieb technisch unvereinbar
und wirken sich auch bei aufgezeichneten Daten auf die späteren Auswertungsvarianten aus.
Für "bewegliche" Pakete stehen fünf verschiedene Filter zur Auswahl: Erscheinen, Verschwinden,
Bestehend, Kapazität und Passierend. Die ersten beiden detektieren das Erscheinen oder Verschwinden
eines Objekts bezüglich eines konfigurierten Bildbereichs. Im Gegensatz zu den Möglichkeiten direkt
auf der Kamera kann dieser nicht nur ein Rechteck sein, sondern eine Polygonfläche, die sich dem
Beobachtungsbereich genau anpassen lässt. "Bestehend" registriert bewegte Objekte, die für einen
vorgegebenen Zeitraum im Konfigurationsbereich verharren. "Kapazität" arbeitet mit einem
Objektzähler, der beim Überschreiten einer vorgegebenen Zahl bewegter Objekte anschlägt. Und "
Passierend" überwacht das Überschreiten einer vorgegebenen Linie, wobei der Anwender auch eine
gewünschte Bewegungsrichtung festlegen kann. Für "stehen gebliebene" Pakete existiert nur ein
Filtertyp "Stehen geblieben/Entfernt".
Die Filter lassen sich interaktiv am (verkleinerten) Livebild definieren, wobei sich noch
Hilfsparamter wie Objektgröße oder Objektgeschwindigkeit mit Minimal- und Maximalwerten festlegen
lassen. Pro Paket kann der Anwender bis zu drei verschiedene Filter kombinieren, wobei sich bei den
"Bewegungstypen" auch eine zeitliche Abfolge definieren lässt. Es ist also möglich, das
Verschwinden eines Objekts in einem Feld mit dem Erscheinen in einem anderen zu kombinieren, oder
das aufeinander folgende Passieren verschiedener Überwachungslinien zu detektieren.
Wie sich zeigt, eröffnet sich hier einerseits eine Vielzahl unterschiedlicher
Einsatzmöglichkeiten, die andererseits aber auch eine neue Herausforderung an den Anwender
darstellt. Im Labortest war es gar nicht so einfach, die unterschiedlichen Grundszenarien
nachzustellen und sauber zu verifizieren – das Handbuch war hierfür jedenfalls keine große Hilfe.
Immerhin: Die Funktionalität ist gewährleistet und überzeugt.
Über die vielfältigeren Detektierungsvarianten hinaus lohnt sich der RSM aber auch noch aus
anderen Gründen: So lassen sich sowohl im Livebild als auch in der Aufzeichnung Objektinformationen
wahlweise einblenden. Dies betrifft beispielsweise Objektrahmen, Zähler und Objekt-IDs oder die
definierten Beobachtungsfelder. Damit ergibt sich eine hervorragende Beobachtungs- und
Analysemöglichkeit, die die Kamera allein nicht bietet. Ein weiterer Zusatznutzen ist die
nachträgliche Analyse von Aufzeichnungen mit vorhandenen oder sogar neu definierten Filterpaketen –
sie müssen lediglich dem ursprünglich verwendeten Typ ("Beweglich" oder "Stehen geblieben")
entsprechen. Dies funktioniert über das RSM-Feature "VMF-Suche", die alle Aufzeichnungen eines
vorgegebenen Zeitraums (zum Beispiel Stunden oder Tage) nach entsprechenden Ereignissen
durchforstet. Dies dauert zwar ein bisschen, hält sich aber in vertretbarem Rahmen.
Videobewegungserkennung ist sicher nicht das einzige Entscheidungskriterium bei der Auswahl
einer Überwachungslösung. Sie wird aber zunehmend wichtiger und dürfte noch erhebliches
Zukunftspotenzial bieten. Mit ihren Methoden der intelligenten Objekterkennung und dem
arbeitsteiligen DEPA-Konzept spielt Sony klar in einer anderen Liga, als viele Konkurrenten, die
noch mit konventioneller Bewegungserkennung arbeiten. Die Sony-Technik überzeugt sowohl in der
Theorie als auch in der Praxis.
Info: Sony Deutschland Tel: 0821/747-2099 Web:
www.sonybiz.net/nvm,
www.sony-videomonitoring.de