
\chapter{Introducción} \label{chapter:introduccion}

En este capítulo se va a introducir el contexto del proyecto y la
motivación existente para la realización del mismo. Se explicará en un
contexto general la visión, los sistemas de vídeo-vigilancia
actuales, los \emph{smartphones}, el concepto de FLOSS (Free Libre
Open Source Software). Y se comentará en un contexto más concreto la
vídeo-vigilancia en el móvil y sistemas de vídeo-vigilancia
distribuidos.


\section{Visión}


La visión artificial es un campo de la inteligencia artificial cuyo
propósito es programar un computador para que ``entienda'' una escena
o ciertas características de una imagen. Esta ciencia posee numerosas
aplicaciones en el mundo real, como puede ser en el ámbito de la
medicina, la industria, la robótica, etc.

La visión es, sin duda, nuestro principal sentido. Gracias a él somos
capaces de recibir información acerca del mundo que nos
rodea. Información que empleamos para desarrollar nuestra inteligencia
y para interactuar con el mundo. Conseguir desarrollar sistemas de
visión y percepción como los del ser humano y aplicarlos implica ser
capaces de disponer de un sistema que reproduce las capacidades
humanas.

Tareas que los humanos realizamos de manera automática, sin dificultad
aparente, se han mostrado como problemas gigantescos para nuestras
máquinas. Reconocer la cara de una persona o patrones de movimientos es
algo automático para los humanos, pero los ordenadores han tardado
años en poder hacer esto de una manera limitada y menos eficaz que la
nuestra.

Hasta comienzos de la década de los 90 no comenzaron a aparecer
ordenadores con velocidad de cómputo suficiente para procesar imágenes
de forma ágil. A partir de entonces, la visión computacional comenzó a
emplearse para múltiples tareas y su desarrollo fue centrándose en
problemas concretos como reconocimiento de objetos, patrones de
movimiento, y reconstrucción 3D. Existen numerosas aplicaciones en el
reconocimiento de objetos, como puede ser reconocer una cara o una
matrícula de un coche.
%(~\ref{fig:face}) o reconocer una matrícula (~\ref{fig:matricula}).

%Cámaras
Actualmente las cámaras son los dispositivos de visión más utilizados
como sensores de percepción para robots y sistemas autónomos. Es el
sensor perfecto para percibir la información sobre el entorno que nos
rodea y así poder analizarlo para tomar decisiones. Actualmente
disponemos en el mercado de numerosas cámaras de variadas
características y en un rango muy grande de precios. Tal es la
diversidad y oferta que podemos encontrar cámaras web mediante
conexión usb en torno a 50\euro (\ref{fig:camera-usb}) con una resolución y
tasa de refresco aceptable para entornos domésticos. También podemos
encontrar en el mercado cámaras \emph{IP} (\ref{fig:camera-ip}), que son accesibles mediante
interfaces de red, poseen un sensor mejor, son capaces de ofrecer
flujo de vídeo y rondan un precio de 500\euro. Por último, podemos
encontrar en el mercado cámaras profesionales pensadas tanto para el
día como para la noche (\ref{fig:camera-pro}) que poseen células de
infrarrojo, un buen sensor \emph{CCD} y resistentes a temperaturas extremas e
incluso al agua. Su precio ronda los 1000\euro.


\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:camera-usb}\includegraphics[width=4.5cm]{img/logitech-webcam}}
\hspace{0.3cm}
\subfigure[]{\label{fig:camera-ip}\includegraphics[width=3.5cm]{img/camera-axis-ip}}
\hspace{0.3cm}
\subfigure[]{\label{fig:camera-pro}\includegraphics[width=4.0cm]{img/sam715}}
\end{center}
\caption{ Cámara doméstica USB (a), cámara IP (b) y cámara profesional
  día/noche (c).}
\label{fig:objetos}
\end{figure}


Gracias a que en los últimos años se ha producido una bajada de
precios considerable en el campo de las cámaras digitales y ha
aumentado el procesamiento y potencia de las \emph{CPUs}, la visión se
ha convertido en un campo en expansión que está dando lugar a un
abanico enorme de potenciales aplicaciones sobre visión.

Uno de los campos que está teniendo gran aceptación de este tipo de
tecnología es el campo de los vídeo juegos. Desde hace un par de años
están saliendo juegos que incorporan cámaras para poder interactuar
con el jugador a través del análisis de imágenes. En la figura
\ref{fig:eye-toy} se puede observar como el juego es capaz de interactuar
con el jugador a través de los movimientos que analiza y detecta a
través de la imagen recogida. Este tipo de cámaras disponibles para
las consolas, no superan los 60\euro.


\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:eye-toy1}\includegraphics[height=4.5cm]{img/eyetoy-kinetic}}
\hspace{0.3cm}
\subfigure[]{\label{fig:eye-toy2}\includegraphics[height=4.5cm]{img/eyetoy-kinetic2}}
\end{center}
\caption{Vídeo juegos que utilizan cámaras y visión para interactuar}
\label{fig:eye-toy}
\end{figure}

Otro ejemplo del uso de cámaras y visión lo tenemos en los deportes. Poco
a poco se va introduciendo esta tecnología para decidir jugadas a
posteriori basándose en vídeos y datos procesados de las imágenes. Así
tenemos ejemplos prácticos de esta tecnología en el fútbol americano o
en el tenis.  El \emph{ojo de
  halcón}\footnote{http://www.hawkeyeinnovations.co.uk/} es una
técnica que se utiliza desde hace varios años en el tenis
profesional. Por medio de 8 cámaras colocadas a lo largo de la pista,
y cubriendo todos los ángulos, es capaz de representar en 3D cualquier
bote de la pelota dentro del campo. Un ejemplo de la representación
que ofrece este sistema lo podemos observar en la figura
~\ref{fig:ojo-halcon}.

\begin{figure}[htbp]
\begin{center}
\includegraphics[height=4.5cm]{img/hawkeye}
\end{center}
\caption{Simulación del sistema \emph{ojo de halcón} (a)}
\label{fig:ojo-halcon}
\end{figure}

Un ejemplo de uso de visión y cámaras llevado a un ámbito totalmente
nuevo y futurista es el acceso o identificación mediante la huella
digital que disponemos en nuestro ojo e iris. Este tipo de tecnología
se utiliza para realizar acceso restringidos a lugares o equipos
informáticos (figura \ref{fig:bio-acceso}). Existen varios métodos, o
se analiza la retina \ref{fig:bio-ojo} o se analiza el iris. Es uno de
los métodos más fiables ya que estudios recientes revelan que para una
población de 200 millones de habitantes la probabilidad de
coincidencia está por debajo del 0.02\%.

\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:bio-acceso}\includegraphics[height=4.0cm]{img/bio-acceso}}
\hspace{0.3cm}
\subfigure[]{\label{fig:bio-ojo}\includegraphics[height=4.0cm]{img/bio-ojo}}
\end{center}
\caption{Acceso al sistema mediante reconocimiento ocular (a) y
  análisis de retina (b)}
\label{fig:biometrico}
\end{figure}



\section{Sistemas de vídeo vigilancia}

% Aplicaciones cámara 
Hasta hace relativamente poco ciertos sistemas utilizaban sensores de
presencia, de paso, o de conteo de personas que se basan en tecnología
limitada como haces de luz para detectar estas situaciones. Gracias a
la llegada de las cámaras se abrió un mercado nuevo donde los
dispositivos de entrada visual tomaron mucha importancia.

En el \emph{Metro de Madrid}, desde hace años disponen un sistema de
vídeo vigilancia basada en cámaras situadas en los andenes de la
estaciones y en los propios metros (\ref{fig:video-metro}). Gracias a
estas cámaras se puede ver y grabar todo lo que ocurre en las
instalaciones, por lo que se pueden recuperar las imágenes cuando sucede
algún imprevisto como peleas, suicidios o averías de los
metros. Recientemente se está poniendo en marcha un nuevo proyecto de
\emph{Vídeo Vigilancia Embarcada en los autobuses de Madrid (EMT)}
(\ref{fig:video-bus}). El objetivo es instalar 9.000 cámaras
repartidas en 2.200 autobuses que cubrirán un total de 10.000 paradas
y 3.600 km de recorrido. Todo ello con el fin de ofrecer seguridad
para los usuarios y trabajadores ya que realiza una grabación continua
de imágenes desde diferentes ángulos para recoger todo lo que ocurre
en el interior del vehículo.

\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:video-metro}\includegraphics[width=6.5cm]{img/videovigilancia-metro}}
\hspace{0.3cm}
\subfigure[]{\label{fig:video-bus}\includegraphics[width=3.5cm]{img/videovigilancia-bus}}
\end{center}
\caption{ Vídeo vigilancia en el metro (a) y en el autobús (b)}
\label{fig:video-vigilancia1}
\end{figure}

Las ciudades también son objetivo y caso de estudio para implantar
sistemas de televisión cerrado (\emph{CCTV}) para mejorar la seguridad
en las calles. Londres, hace 3 años comenzó un proyecto para dotar de
más de 10.000 cámaras las calles londinenses con el fin de vigilar y
solucionar los posibles crímenes producidos
(\ref{fig:vigila-londres}). Del mismo modo Madrid ha empezado a dotar
de cámaras ciertos barrios, el primero de ellos el \emph{Barrio de las
  letras}. En este barrio, se han instalado decenas de cámaras para
controlar la entrada (sólo autorizada a vehículos privados que viven
en la zona) y multar automáticamente a todos aquellos coches cuyas
matrículas no estén incluidas en un listado predeterminado (figura
\ref{fig:video-madrid}). La medida podría extenderse a zonas con las
mismas restricciones al tráfico rodado, como \emph{La puerta del Sol}
o \emph{Las Cortes}.

\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:vigila-londres}\includegraphics[height=4.5cm]{img/vigila-londres}}
\hspace{0.3cm}
\subfigure[]{\label{fig:video-madrid}\includegraphics[height=4.5cm]{img/vigila-madrid}}
\end{center}
\caption{ Vídeo vigilancia ciudadana en Londres (a) y control de
  acceso en Madrid (b)}
\label{fig:vigila-ciudades}
\end{figure}


La \emph{Dirección General de Tráfico} tiene una red de cámaras
desplegadas en las principales ciudades y arterias de comunicación del
país para poder vigilar el tráfico y detectar infracciones en las
carreteras (\ref{fig:dgt-camara}). Además, desde hace algunos años cierta información de
estas cámaras se pone a disposición del ciudadano para poder observar
el tráfico, con lo que obtenemos un nuevo uso de estos sistemas: el de
informar. Actualmente existen más de 700 cámaras (oficiales y
personales) repartidas por toda España ofreciendo imágenes en tiempo
real de la situación del tráfico en las carreteras. Incluso la
\emph{DGT} ha empleado el uso de cámaras y visión para informar y
detectar infracciones desde el cielo, utilizando cámaras
especializadas en los helicópteros como se puede observar en la
fig.~\ref{fig:dgt-helicoptero}.


\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:dgt-camara}\includegraphics[width=5.0cm]{img/dgt-camara}}
\hspace{0.3cm}
\subfigure[]{\label{fig:dgt-helicoptero}\includegraphics[width=4.5cm]{img/dgt-helicoptero}}
\end{center}
\caption{ Cámara fija vigilando el tráfico (a) y detección de
  infracciones desde el helicóptero (b)}
\label{fig:dgt}
\end{figure}

Todos los sistemas que anteriormente se han comentado son sistemas
profesionales, pensados para la seguridad y la información y diseñados
para ofrecer un servicio constante e ininterrumpido. Pero aún distan
de ser unos sistemas autónomos, inteligentes, de bajo coste,
escalables e interoperables entre si. Estos sistemas necesitan
obligatoriamente de un centro de control de vídeo vigilancia donde se
reciben todas las señales de vídeo y donde son analizadas por personas
durante 24 horas al día para detectar situaciones anómalas, tal como se
muestra en la figura~\ref{fig:dgt-sala}. Estas personas son necesarias porque los
sistemas no son inteligentes, no son capaces por sí solos de detectar
si un peatón está caído en un paso de cebra, o si un coche realiza
\emph{zig-zags} en una carretera, o advertir un posible atasco
porque el flujo de coches está aumentando. A causa de que no hay
\emph{software} inteligente, el \emph{hardware} se encarece para poder realizar
algunas tareas básicas como detectar el movimiento, poder grabar
a flujos altos de vídeo para su posterior revisión, o incluso se
encargan de la comunicación IP y gestión de alarmas. Por último la
escalabilidad de estos sistema suele ser costosa, ya que cada sistema
utiliza su propio \emph{hardware}, \emph{software} y protocolos (la
mayoría de ellos propietarios). La posibilidad de añadir una cámara
diferente al sistema, o incorporar un nuevo algoritmo a veces puede
llegar a ser tan costoso que se desestima la ampliación del sistema.


\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:dgt-sala-sevilla}\includegraphics[width=5.5cm]{img/dgt-sevilla}}
\hspace{0.3cm}
\subfigure[]{\label{fig:dgt-helicoptero}\includegraphics[width=6.5cm]{img/dgt-valencia}}
\end{center}
\caption{Salas de control de tráfico de la DGT en Sevilla (a) y en
  Valencia (b) }
\label{fig:dgt-sala}
\end{figure}


\subsubsection{Vídeo vigilancia en la vida cotidiana}

La llegada de las nuevas tecnologías a un precio razonable para la
sociedad ha provocado que los sistemas de vídeo vigilancia proliferen
en diversos y multitudinarios ámbitos. Actualmente es normal ver
sistemas de vídeo-vigilancia modestos en pequeños comercios, restaurantes,
sucursales bancarias, urbanizaciones, pisos, ...

Los sistemas disponibles para este sector suelen ser sistemas muy
sencillos, basados en un par de cámaras y un receptor de señal donde
se guardan las grabaciones. Pero la mayoría no dispone de
comportamientos inteligentes mediante análisis de imágenes y además es
bastante complicado integrar nuevos dispositivos en el sistema, como
por ejemplos los dispositivos móviles.


\section{Vídeo vigilancia con teléfonos móviles inteligentes}

Desde la existencia del teléfono móvil, siempre se ha tenido un gran
interés para integrarlo con todo lo que nos rodea: control del coche,
de la casa, del sistema de seguridad de los hogares, etc. Hasta la
existencia de los dispositivos móviles inteligentes, la interacción no
iba mas allá de un mero mensaje de texto (\emph{SMS}), o como máximo
una imagen de baja resolución y detalle enviado a través de \emph{MMS}.

\subsubsection{Teléfonos móviles inteligentes}

El \emph{smartphone} o teléfono inteligente es un dispositivo
electrónico que funciona como un teléfono móvil con características
similares a las de un ordenador. Una característica importante de
estos dispositivos es que permiten la instalación de programas para
incrementar la funcionalidad y procesamiento de datos. Es común que
dispongan de interfaces hasta hace poco impensables en los móviles,
como puede ser un teclado \emph{QWERTY}, pantalla táctil, o acceso a
internet a través de tecnología 3G/4G o wifi.

El primer teléfono inteligente vino de la mano de \emph{IBM} en el año
1992. \emph{Simon}, que fue como lo bautizaron, fue comercializado por
\emph{BellSouth} y tenía características muy avanzadas para su época
como calendario, libreta de direcciones, correo electrónico, emisor y
receptor de \emph{fax} y poseía una pantalla táctil para seleccionar los
contactos o teléfonos con el dedo, tal como se observa en la
figura~\ref{fig:phone-ibm}. A partir de entonces competidores del
sector como \emph{Nokia}, \emph{Microsoft} o \emph{Ericsson} y otros
comenzaron a comercializar sus \emph{smartphones} generando tal
cantidad de productos que en el año 2008 se vendieron más de 162
millones de \emph{smartphones} en todo el mundo. 2008 fue el primer
año que las ventas de \emph{smartphones} superaron a las ventas de
ordenadores portátiles y las previsiones de los expertos estiman que
para el año 2013 se incrementen las ventas de teléfonos inteligentes
en un 38\%. 

Evaluando estos datos, no es casualidad que las compañías más
poderosas del mundo hayan realizado un cambio de rumbo en sus
estrategias ya que el \emph{smartphone} es un dispositivo a explotar
en los próximos 5-10 años. \emph{Google} y \emph{Apple} son dos de las
empresas que han visto el negocio y la necesidad tecnológica que tiene
la sociedad de disponer de \emph{smartphones} cada vez más rápidos,
más modernos y con más utilidades. Apple se introdujo en el mercado en
a mediados del 2007 cuando presentó su
\emph{iPhone} (fig.~\ref{fig:phone-iphone}). Fue nombrado ``invento del año''
por la revista \emph{Times} en el 2008 y hasta el día de hoy ha vendido cerca
de 50 millones de unidades en todo el mundo. 

Por su parte Google, apostó por desarrollar un sistema operativo para
móviles basado en software libre, \emph{Android}. Este desarrolló está
realizado en el marco de la \emph{Open Handset Alliance (OHA)}, una
alianza de 65 empresas del sector cuyo objetivo es desarrollar
estándares abiertos y dispositivos móviles. El primer móvil Android que
comercializó Google junto con HTC fue el \emph{HTC Dream} en Octubre
de 2008. En abril de 2009, 6 meses después, había vendido más de 1
millón de dispositivos sólo en Estados Unidos. Actualmente existen más
de 100 modelos distintos de \emph{smartphones}, comercializados por
más de 30 empresas distintas, que llevan Android instalado. Uno de los
más potentes actualmente es el \emph{Nexus
  One} (fig.~\ref{fig:phone-android}), comercializado por Google.


\begin{figure}[htbp]
\begin{center}
\subfigure[]{\label{fig:phone-ibm}\includegraphics[height=6.0cm]{img/simon-ibm}}
\hspace{1.0cm}
\subfigure[]{\label{fig:phone-iphone}\includegraphics[height=6.0cm]{img/iphone-3gs}}
\hspace{1.0cm}
\subfigure[]{\label{fig:phone-android}\includegraphics[height=6.0cm]{img/nexus-one}}
\end{center}
\caption{ Primer smartphone Simon-IBM (a), iPhone de Apple (b) y Nexus
  One de Google (c)}
\label{fig:smartphone}
\end{figure}

La acogida de estos nuevos dispositivos es tan alta por parte de la sociedad,
que la industria ha visto la necesidad de portar aplicaciones, que
históricamente se han usado en el ordenador, a los \emph{smartphone}. Correo
electrónico, acceso a las redes sociales y servicios web,
reproductores multimedia (audio y vídeo) son entre otras, aplicaciones
demandadas en estos dispositivos móviles. Por ello, uno de los
objetivos de este proyecto es disponer de una aplicación en un
\emph{smartphone} para poder controlar y visualizar un sistema de
vídeo vigilancia.

\subsubsection{Vídeo vigilancia distribuida}

La motivación de este proyecto es generar un sistema distribuido de vídeo
vigilancia que se integre y se puede interaccionar con él a través de
un dispositivo móvil inteligente. La configuración típica de este sistema
es una o más cámaras repartidas por un escenario más un conjunto de
computadores (\emph{pc}) y dispositivos móviles.

Una de las características importantes del sistema que
desarrollaremos es que estará basado en software libre y será software
libre. El software libre es la denominación al software que respeta la
libertad de los usuarios sobre su producto adquirido, y por tanto, una
vez obtenido puede ser usado, copiado, estudiado y redistribuido
libremente. Según la \emph{Free Software Foundation}, el software
libre se refiere a la libertad de los usuarios para ejecutar, copiar,
distribuir, estudiar, modificar el software y distribuirlo modificado.

El uso del software libre no se limita únicamente a una razón
filosófica o de pensamiento, tiene muchos beneficios prácticos. Ofrece
\texttt{independencia tecnológica}, ya que gracias a la posibilidad de
acceder al código permite el desarrollo de nuevos productos sin
necesidad de partir desde cero. El secretismo tecnológico es uno de
los grandes frenos y desequilibrios existentes para el desarrollo en el
modelo de propiedad intelectual. El software libre fomenta \texttt{la
  libre competencia} al basarse en servicios y no en licencias, lo que
provoca una mayor atención y trato al cliente al contrario de los
sistemas sostenidos por la venta de licencias. El acceso al código por
numerosas personas favorece el tener \texttt{sistemas sin puertas
  traseras y más seguros}, y permite \texttt{correcciones rápidas y
  eficientes de fallos}. Por último, existen estudios que aseguran que
el uso del software libre favorece la economía local, dando más dinero
y puestos de trabajo al país donde se desarrolla y no en el extranjero.

\vspace{1.0cm}

En el Grupo de Robótica de la Universidad Rey Juan Carlos se han
desarrollado proyectos que podrían utilizar nuestro proyecto para
ofrecer una funcionalidad añadida y de calidad, como es realizar
grabaciones y detección de alarmas en su sistema, lo que es una gran
motivación y satisfacción realizar este proyecto. Nos referimos a
proyectos con diversos fines, como el posicionamiento 3D de personas
en un recinto y detectar las posibles caídas (\cite{sara09}), o 
proyectos que tratan de detectar las velocidades de los coches
(\cite{victor08}), o clasificarlos en diferentes tipos de vehículos
(\cite{redo10}), o por último, proyectos que detectan y realizan un
seguimiento de caras (\cite{javier08}).

Este proyecto también tiene la intención de seguir desarrollando y
ayudando al aumento de funcionalidades de la plataforma
\emph{JDEROBOT}, que inició sus orígenes en el 2003
(\cite{jmplaza-tesis}), y que ha sufrido varios cambios en su diseño
con sucesivos proyectos destinados a tal fin (\cite{lobato04} y
\cite{lobato10}).

\vspace{1.0cm}

La presente memoria detalla todos los aspectos relevantes del
desarrollo de este sistema distribuido de vídeo vigilancia. Esta
memoria se compone de 6 capítulos. El capítulo 2 trata los objetivos y
requisitos planteados para el proyecto. El capítulo 3 ofrece una
descripción de la infraestructura sobre la que ha sido realizado. La
descripción informática, la implementación y detalles del
comportamiento se exponen en el capítulo 4. En el capítulo 5 el modelo
de explotación y el modelo de negocio basado en software libre. Por
último, en el capítulo 6 se reflejan las conclusiones extraídas sobre
la realización de este proyecto y las posibles líneas futuras de
mejora que se pueden aportar.



