Αλγόριθμοι που μπορούν να «δουν» εικόνες στο διαδίκτυο

Αλγόριθμοι που μπορούν να «δουν» εικόνες στο διαδίκτυο

Οι ηλεκτρονικοί υπολογιστές δεν μπορούν στην πραγματικότητα να «δουν» το περιεχόμενο των εικόνων στο διαδίκτυο. Αυτό όμως φαίνεται πως αλλάζει.

της Έριν Γκρίφιθ

Χάρη στα έξυπνα τηλέφωνα, οι φωτογραφίες είναι η νέα γλώσσα του διαδικτύου. Κάθε μέρα, 1,8 δισεκατομμύρια νέες εικόνες ανεβαίνουν στο Ίντερνετ. Το μόνο πρόβλημα με όλο αυτό τον διαμοιρασμό φωτογραφιών είναι ότι όλη η υποδομή του διαδικτύου έχει οικοδομηθεί γύρω από το κείμενο. Ακόμα και η λειτουργία αναζήτησης εικόνων της Google βασίζεται σε κείμενο για τον προσδιορισμό των εικόνων. Άρα, είναι απαραίτητο να διδάξουμε τους υπολογιστές μας να βλέπουν τις φωτογραφίες, ώστε να μπορέσουμε να επιβιώσουμε σε μια ολοένα και μεγαλύτερη θάλασσα εικόνων. Όπως μπορείτε να φανταστείτε, κάτι τέτοιο δεν είναι διόλου εύκολο.

Τη δεκαετία του ’80, ερευνητές κατασκεύασαν μια αρχιτεκτονική «σπειροειδούς νευρικού δικτύου», αλλά αυτοί οι πρώιμοι αλγόριθμοι υπολογιστικής όρασης δεν ήταν πολύ ισχυροί όταν «έτρεχαν» σε συμβατικούς επεξεργαστές. Ο προγραμματισμός τους, όμως, για να τρέχουν σε μοντέρνους επεξεργαστές γραφικών άλλαξε τα πάντα. Αυτό συνέβη γύρω στο 2009. «Ένας ακαδημαϊκός κλάδος για …σπασίκλες αναδεικνύεται πλέον σε σημαντικό τρόπο κατανόησης του Ίντερνετ», λέει ο Σον Ζακάρια, επικεφαλής τεχνολογίας της TripleLift, μιας startup που χρησιμοποιεί την υπολογιστική όραση για τη βελτιστοποίηση των ψηφιακών διαφημίσεων. Και δεν είναι η μόνη.

Για παράδειγμα, η εταιρεία Clarifai ανέπτυξε έναν αλγόριθμο που αναλύει πολλές εκατοντάδες εικόνες ανά δευτερόλεπτο για πελάτες, όπως εταιρείες κοινωνικής δικτύωσης, ιστοσελίδες με λίστες ακινήτων προς πώληση και ενοικίαση, και εταιρείες ηλεκτρονικού εμπορίου. Η τεχνολογία της Clarifai μπορεί να προσδιορίσει μια εικόνα, να την κατηγοριοποιήσει, και να ομαδοποιήσει παρεμφερείς εικόνες.

Η Body Labs, εντωμεταξύ, δημιουργεί τρισδιάστατα μοντέλα σωμάτων, που χρησιμοποιούνται από τον αμερικανικό στρατό για τη βελτίωση της αντιβαλλιστικής προστασίας των γυναικών στρατιωτών. Και η Floored μετατρέπει τρισδιάστατα μοντέλα εσωτερικού των κτιρίων σε διαδραστικά γραφικά, έτσι ώστε οι εν δυνάμει πελάτες να μπορούν να ζήσουν την εμπειρία της παρουσίας τους σε ένα ακίνητο μέσω βίντεο ή εξοπλισμού εικονικής πραγματικότητας.

Πλέον, η προσπάθεια εστιάζεται στην εφαρμογή αυτών των δεξιοτήτων ανάγνωσης εικόνας από τους ηλεκτρονικούς υπολογιστές μας.

Α, και που λέτε… Στο ένα λεπτό που χρειαστήκατε για να διαβάσετε το παρόν άρθρο, 1,25 εκατομμύρια εικόνες ανέβηκαν στο διαδίκτυο!