Η Google αναγνωρίζει το πρόσωπό σας ανάμεσα σε εκατομμύρια

Η Google αναγνωρίζει το πρόσωπό σας ανάμεσα σε εκατομμύρια

Η νέα τεχνολογία αναγνώρισης προσώπου είναι ένα μεγάλο βήμα προς την τεχνητή νοημοσύνη και το deep learning.

Το σύστημα λέγεται Facenet και είναι δημιούργημα τριών ερευνητών της Google. Σύμφωνα με το paper που δημοσίευσαν, πρόκειται για την ακριβέστερη μέθοδο αναγνώρισης προσώπου που χρησιμοποιεί την database Labeled Faces in the Wild, μια δημόσια ανοιχτή βάση δεδομένων με δημόσια πρόσωπα, η οποία χρησιμοποιείται για ερευνητικούς σκοπούς.

Εκπαιδευμένο σε μια βάση δεδομένων 260 εκατ. εικόνων γενικά από το Internet, το Facenet μάντεψε σωστά στο 86% των περιπτώσεων του Labeled Faces in the Wild. Η συγκεκριμένη βάση χρησιμοποιείται ως σημείο αναφοράς και κάθε κατασκευαστής software αναγνώρισης προσώπου μετρά εκεί τα αποτελέσματά του.

Τον περασμένο Δεκέμβριο μια ομάδα Κινέζων ερευνητών υποστήριξε ότι πέτυχε ακρίβεια 99%, ενώ ερευνητές της Facebook ανακοίνωσαν ότι πέτυχαν 97%. Πώς, λοιπόν, η μέθοδος της Google ξεχωριζει; Η Google δεν ακολούθησε την πεπατημένη, σύμφωνα με την οποία απλώς διαπιστώνεις αν δύο εικόνες δείχνουν τον ίδιο άνθρωπο. Η μέθοδός της εξετάζει το πρόσωπο καθ’ αυτό και του δίνει όνομα.

Οι έρευνες αυτές θα έχουν εφαρμογή σε πολλά πεδία: από την καταπολέμηση του εγκλήματος μέχρι την αυτόματη επιλογή στο Tinder. Θέλετε κάποιον/αν που να μοιάζει όσο γίνεται περισσότερο στον/στην πρώην σας ή στον αγαπημένο σας σταρ του σινεμά; Ορίστε 500 προφίλ που προσομοιάζουν περισσότερο.

Το σύστημα της Facebook λέγεται DeepFace και, μαζί με το Facenet, θα τα δούμε πιθανότατα στις εφαρμογές social media των εταιρειών να μας βοηθούν να tagάρουμε πρόσωπα και να ψάχνουμε για ανθρώπους που δεν είναι tagged. Οι εταιρείες θα βρουν πολύ ενδιαφέρον το να ξέρουν π.χ. ποιοι διάσημοι ηθοποιοί και τραγουδιστές απεικονίζονται συχνότερα στα προφίλ και στον τοίχο των χρηστών, ακόμα και αν δεν τους έχουν ονοματίσει.

Η τεχνολογία πίσω από αυτές τις εξελίξεις λέγεται deep learning και είναι μια μορφή τεχνητής νοημοσύνης η οποία επιτρέπει στους υπολογιστές να αναγνωρίζουν τοπία, αντικείμενα, επιγραφές, ακόμα και χειρόγραφα και ήδη λειτουργεί σε εφαρμογές όπως το Google Goggles και το Evernote με ακρίβεια μεγαλύτερη από εκείνη των ανθρώπων.

Η Microsoft, η Yahoo και η Baidu χρησιμοποιούν και εκείνες μεθόδους deep learning και τις εφαρμόζουν στις φωνητικές εντολές των κινητών, στην αυτόματη μετάφραση φωνής του Skype, στην πρόβλεψη κειμένου και στην αναζήτηση αντικειμένων μέσα σε εικόνες. Το Spotify και το Netflix τις χρησιμοποιούν για να βελτιώσουν τις προτάσεις τους και το PayPal για να μειώσει τις περιπτώσεις απάτης.