Ο τυφλός μηχανικός λογισμικού της Microsoft που μετέτρεψε την τεχνητή νοημοσύνη σε εργαλείο όρασης

SAQIB SHAIKH

Μηχανικός Λογισμικού Microsoft

O επικεφαλής μηχανικός λογισμικού της Microsoft που ανέπτυξε την εφαρμογή Seeing AI, που βοηθάει άτομα με προβλήματα όρασης να αντιληφθούν τον κόσμο γύρω τους, εξηγεί στο FORTUNEGREECE πως η τεχνητή νοημοσύνη μπορεί να χρησιμοποιηθεί για το κοινό καλό.

Η θέση της τεχνητής νοημοσύνης στην δημόσια συζήτηση, στην διεθνή βιβλιογραφία αλλά και στην δημοσιογραφία έχει ακολουθήσει πορεία ανάλογη με πολλά άλλα τεχνολογικά φαινόμενα, όπως τα κοινωνικά δίκτυα. Από τον ουτοπισμό των αρχων της δεκαετίας που διανύουμε, όπως για παράδειγμα κατά την «Αραβική Άνοιξη», στην εξαιρετικά κριτική στάση απέναντι στις εφαρμογές και τις συνέπειες τους.

Όμως, αντίθετα παραδείγματα και υπάρχουν και θα πρέπει να αναλύονται. Όπως η δουλειά που κάνει ο μηχανικός λογισμικού στο εργαστήριο τεχνητής νοημοσύνης της Microsoft, Saqib Shaikh.

Τυφλός από την ηλικία των επτά ετών, ο Shaikh ήθελε να σχεδιάσει ένα εργαλείο που θα περιγράφει τον κόσμο ώστε να βοηθήσει τους ανθρώπους με προβλήματα όρασης.

Μαζί με την ομάδα της οποίας ηγείται, ανέπτυξε την εφαρμογή Seeing AI, η οποία χρησιμοποιεί την κάμερα και τεχνητή νοημοσύνη για να περιγράψει στον χρήστη τι «βλέπει». Μπορεί να «διαβάσει» από μενού μέχρι πρόσωπα και φωτογραφίες, ενώ η λίστα των καταστάσεων στις οποίες μπορεί να βοηθήσει άτομα με προβλήματα όρασης, συνεχώς μεγαλώνει.

Ο Saqib βρέθηκε πρόσφατα στην Αθήνα για το Microsoft Summit ώστε να παρουσιάσει το έργο της εταιρείας στον τομέα της τεχνητής νοημοσύνης, και το FORTUNEGREECE δεν έλειψε να ζητήσει την άποψη του για την δουλειά του αλλά και για τον τομέα της τεχνητής νοημοσύνης γενικότερα.

Κατανοούμε πως η προέλευση της εφαρμογής είναι βαθιά προσωπική. Πως και πότε σας ήρθε η ιδέα της Seeing AI app?

Ως μηχανικός, πάντα περιεργάζομαι τα πράγματα γύρω μου και πώς θα μπορούσαν να γίνουν καλύτερα. Ως τυφλός, από τότε που έμαθα προγραμματισμό, δημιουργούσα  μικρά εργαλεία για να βοηθήσω τον εαυτό μου.

Όταν περνάω χρόνο με την οικογένειά μου και τους στενούς μου φίλους, περιγράφουν με φυσικότητα τα πράγματα που συμβαίνουν γύρω τους, χωρίς να το σκέπτονται. Και όταν πρέπει να φέρουμε εις πέρας εργασίες μαζί, αυτόματα συζητάμε μεταξύ μας. Όταν σπούδασα τεχνητή νοημοσύνη στο πανεπιστήμιο πριν από πολλά χρόνια, μου προέκυψε αυτή η γενική ιδέα: θα ήταν ωραίο αν μια μέρα η τεχνητή νοημοσύνη ήταν αρκετά ανεπτυγμένη ώστε να δημιουργεί αυτή την εμπειρία ακόμα και όταν είμαι μόνος.

Είμαστε ακόμα πολλά χρόνια από την πραγματοποίηση αυτού του οράματος, αλλά τα τελευταία χρόνια, μια ομάδα παθιασμένων μηχανικών και επιστημόνων της Microsoft συναντήθηκαν για να αναπτύξουν την δωρεάν εφαρμογή Seeing AI iOS.

Περιγράψτε μας την πορεία ανάπτυξης της εφαρμογής σας από μια ιδέα σε ολοκληρωμένο project. Παρατηρήσατε μετασχηματισμούς σχετικά με τον τρόπο με τον οποίο οι συνάδελφοι σας προσέγγιζαν την τεχνητή νοημοσύνη έπειτα από την συμμετοχή τους στην ανάπτυξη της εφαρμογής;

Κάθε χρόνο, η Microsoft διοργανώνει έναν διεταιρικό μαραθώνιο, κατά τη διάρκεια του οποίου οι εργαζόμενοι ενθαρρύνονται να συμμετέχουν σε κάτι διαφορετικό. Στον πρώτο μαραθώνιο ξεκίνησα να συγκεντρώνω τα πιο εξελιγμένα και νεοφυή εργαλεία στον τομέα της τεχνητής νοημοσύνης για να διερευνήσω πώς οι εξελίξεις στην υπολογιστική όραση θα μπορούσαν να αξιοποιηθούν για να ενδυναμώσουν την κοινότητα των τυφλών.

Την επόμενη χρονιά, συμμετείχα σε ομάδα με μηχανικούς και ερευνητές από όλη την εταιρεία και πολλές λύσεις συναντήθηκαν. Το αποτέλεσμα αυτής της ομαδικής προσπάθειας είναι η εφαρμογή Seeing AI, την οποία η Microsoft κυκλοφόρησε επίσημα στο iOS τον Ιούλιο του 2017. Είμαστε ενθουσιασμένοι με αυτήν την τεχνολογία και την αξία που έχει για τα άτομα που είναι τυφλά ή με προβλήματα όρασης.

Μπορείτε να περιγράψετε μια κατάσταση κατά την οποία η εφαρμογή αποδείχθηκε ιδιαίτερα χρήσιμη;

Η εφαρμογή είναι χρήσιμη σε διάφορες εργασίες κατά τη διάρκεια της ημέρας. Για παράδειγμα, μπορεί να με βοηθήσει να διαβάσω ένα έγγραφο και να ταξινομήσω το πορτοφόλι μου αναγνωρίζοντας τα χαρτονομίσματα.

Απολαμβάνω να ακούω ιστορίες για το πώς οι χρήστες χρησιμοποιούν την εφαρμογή στη ζωή τους. Από τη δασκάλα που χρησιμοποιεί την εφαρμογή για να αναγνωρίσει τα παιδιά καθώς μπαίνουν στην τάξη, στη μητέρα που χρησιμοποιεί την εφαρμογή για να οργανώσει τις φωτογραφίες των παιδιών της, ώστε να τις στέλνει στους παππούδες. Η εφαρμογή ανοίγει τον δρόμο στους χρήστες να βιώσουν για πρώτη φορά ένα σύνολο εμπειριών, όπως η ανάγνωση ενός καταλόγου στο εστιατόριο, selfies, και την δυνατότητα χρήσης μηχανημάτων αυτόματης πώλησης χωρίς βοήθεια.

Η χρήση της τεχνητής νοημοσύνης σε αμφιλεγόμενα projects έχει συγκεντρώσει τα φώτα της δημοσιότητας τον τελευταίο καιρό. Μπορούν εφαρμογές όπως η δική σας να θεμελιώσουν ένα διαφορετικό πρότυπο; Πιστεύετε ότι η χρήση της τεχνητής νοημοσύνης και των βαθεών νευρωνικών δικτύων φέρει μαζί του ηθική ευθύνη;

Η Microsoft προσπαθεί να καταστήσει την τεχνητή νοημοσύνη προσιτή σε κάθε άτομο και οργάνωση. Ο στόχος μας είναι να αυξήσουμε και να ενισχύσουμε την ανθρώπινη ευστροφία με την χρήση έξυπνης τεχνολογίας και τεχνητής νοημοσύνης σε ό, τι κάνουμε – και το πράττουμε αυτό προσεγγίζοντας προσεκτικά τον σχεδιασμό συστημάτων τεχνητής νοημοσύνης που επεκτείνουν και ενισχύουν τις ανθρώπινες δυνατότητες σε όλες τις πτυχές της ζωής.

Καθώς τα συστήματα AI γίνονται πιο εξελιγμένα και αρχίζουν να διαδραματίζουν μεγαλύτερο ρόλο στη ζωή μας, είναι επιτακτική ανάγκη οι εταιρείες να αναπτύξουν και να υιοθετήσουν σαφείς αρχές που θα καθοδηγούν τους ανθρώπους που αναπτύσσουν, χρησιμοποιούν, και εφαρμόζουν τεχνητή νοημοσύνη. Πιστεύουμε ότι αυτές οι αρχές πρέπει να διασφαλίζουν ότι αυτά τα συστήματα θα είναι δίκαια, αξιόπιστα, ασφαλή και ιδιωτικά, χωρίς αποκλεισμούς, διαφανή και υπεύθυνα.

Πώς πιστεύετε ότι η τεχνολογία θα επηρεάσει την καθημερινή ζωή τα επόμενα 10 έως 20 χρόνια;

Η τεχνητή νοημοσύνη είναι τεχνολογία που μπορεί να αντιληφθεί, να μάθει και να σκεφτεί λογικά ώστε να οδηγήσει στην επέκταση των δυνατοτήτων των ανθρώπων και των οργανισμών. Σήμερα, έχουμε ξύσει μόνο την επιφάνεια σχετικά με το τι μπορεί η τεχνητή νοημοσύνη να μας βοηθήσει να πετύχουμε. Ανυπομονώ να βρεθώ σε έναν κόσμο όπου άνθρωποι και οι μηχανές θα συνεργάζονται για να εκμεταλλευτούν αυτό που κάνει τους ανθρώπους μοναδικούς και θα μας ενδυναμώνουν προκειμένου να επιτύχουμε περισσότερα.