L'app Zensors ti consente di monitorare in crowdsourcing le telecamere dal vivo

Se senti di aver bisogno di occhi nella parte posteriore della testa, c'è un'app di crowdsourcing per questo.

Zensors è un'applicazione per smartphone in grado di monitorare un'area di interesse utilizzando una telecamera, lavoratori in crowdsourcing e intelligenza artificiale.

Sviluppato dai ricercatori della Carnegie Mellon University e dell'Università di Rochester, l'idea alla base di Zensors è quella di utilizzare qualsiasi telecamera in una posizione fissa per rilevare i cambiamenti in ciò che viene monitorato, ad esempio se la ciotola per alimenti di un animale domestico è vuota e avvisare automaticamente gli utenti.

Gli sviluppatori affermano che è un modo economico e accessibile per aggiungere sensori all'ambiente, parte del passaggio verso la costruzione di case intelligenti e città intelligenti.

Il progetto, presentato alla Conferenza Computer-Human Interaction (CHI) del 2015 a Seoul questa settimana, si basa su semplici domande degli utenti scritte in un linguaggio quotidiano sull'area da monitorare.

Ad esempio, una domanda potrebbe essere: c'è un'auto nel parcheggio? La presenza di un'auto innescherebbe una risposta positiva nell'avviso all'utente, che potrebbe essere inviata tramite e-mail o messaggio di testo.

La videocamera potrebbe essere il sensore di immagine in qualsiasi dispositivo mobile, a condizione che sia stata configurata per monitorare qualcosa o una webcam, una videocamera di sicurezza o qualsiasi altra videocamera collegata. Acquisirà le immagini ad un intervallo impostato dall'utente.

Gli utenti selezionano innanzitutto una regione di interesse nella vista della telecamera cerchiala con un dito su un touchscreen, che ha lo scopo di limitare la sorveglianza e proteggere la privacy delle persone che potrebbero entrare a far parte del frame.

Successivamente, viene inserita una domanda nell'app Zensors e il lavoro di monitoraggio delle immagini viene trasferito su Internet. Le immagini ridondanti in cui nulla è cambiato vengono automaticamente ignorate.

Le persone che effettuano il monitoraggio iniziale potrebbero essere il personale di un call center o un servizio di outsourcing come il Turk meccanico di Amazon, che è stato utilizzato nello studio della CMU. Quando i monitor decidono che la domanda ha una risposta affermativa, presto un grafico nell'app cambia; potrebbe anche inviare avvisi agli utenti.

Zensors diventa interessante, tuttavia, quando il processo diventa automatico. Dopo un certo periodo di monitoraggio umano, gli algoritmi di apprendimento automatico nel software possono apprendere quando una determinata condizione è stata soddisfatta. Ad esempio, potrebbero imparare a riconoscere che la ciotola del cibo di un animale domestico è vuota.

Per garantire l'accuratezza degli algoritmi, il sistema verrebbe periodicamente controllato dai lavoratori, il che potrebbe assumere un ruolo più pratico se l'area monitorata presenta un cambiamento inatteso.

È inoltre possibile aggiungere strumenti di visione artificiale al trattamento dei dati, consentendo al sistema di eseguire attività come il conteggio di auto o persone in una determinata area.

In una dimostrazione, uno smartphone con Zensors è stato messo a faccia in su su un tavolo. È stata inserita una domanda: "C'è una mano?" Dopo aver tenuto una mano sulla fotocamera del telefono, il grafico dell'app è cambiato, mostrando che i lavoratori di Mechanical Turk avevano risposto da lontano. I ricercatori hanno accusato la latenza della rete per il fatto che la risposta ha richiesto circa 30 secondi.

Con una migliore reattività, Zensors potrebbe essere utilizzato in una varietà di applicazioni aziendali e domestiche. Un responsabile del ristorante potrebbe utilizzarlo per sapere quando è necessario ricaricare gli occhiali dei clienti e le società di sicurezza potrebbero utilizzarlo per il monitoraggio automatico.

"Siamo i primi, per quanto ne so, a fondere la folla con la formazione sull'apprendimento automatico e in realtà farlo", ha affermato Gierad Laput, uno studente di dottorato presso l'Istituto di interazione uomo-computer di Carnegie Mellon, che ha anche mostrato nuove interfacce per smartphone al CHI.

Il costo del monitoraggio umano è di 2 centesimi per immagine, secondo i ricercatori. Costa circa $ 15 di dati verificati dall'uomo per addestrare gli algoritmi in modo che possano subentrare.

Al contrario, avere un programmatore che scrive software di visione artificiale per un sensore che risponde a una domanda sì o no di base potrebbe richiedere più di un mese e costare migliaia di dollari.

"L'elaborazione del linguaggio naturale, l'apprendimento automatico e la visione artificiale sono tre dei problemi più difficili dell'informatica", ha affermato Chris Harrison, assistente professore di interazione uomo-computer presso la CMU. “La folla ci consente praticamente di bypassare molto di tutto ciò. Ma lasciamo semplicemente che la folla faccia il lavoro di bootstrap e otteniamo ancora i vantaggi dell'apprendimento automatico. ”

I ricercatori hanno in programma di continuare a migliorare l'app Zensors, ora in versione beta, e quindi di rilasciarla al pubblico.

Unisciti alle community di Network World su Facebook e LinkedIn per commentare argomenti che sono importanti.