Το Διαδίκτυο έχει αλλάξει: Από ένα μέσο που βασιζόταν σχεδόν εξ ολοκλήρου στο κείμενο, έχει πλέον αρχίσει να κυριαρχείται από εικόνες. Υπολογίζεται ότι περίπου 1,8 δισεκατομμύρια εικόνες «ανεβαίνουν» κάθε μέρα σε κοινωνικά δίκτυα όπως το Twitter, το Instagram και το Facebook.
Καλά τα νέα λοιπόν για τους επίδοξους φωτογράφους, άσχημα όμως για τους τυφλούς ή όσους έχουν χρήστες έχουν προβλήματα όρασης, οι οποίοι συχνά δεν έχουν τρόπο να καταλάβουν τι δείχνει μια εικόνα, παρά τις σύγχρονες βοηθητικές τεχνολογίες.
Όμως μια νέα υπηρεσία του Facebook, επιχειρεί να διορθώσει την κατάσταση: το δημοφιλέστατο δίκτυο κοινωνικής δικτύωσης εγκαινιάζει ένα σύστημα το οποίο μπορεί να «διαβάσει» τις φωτογραφίες και να περιγράψει φωνητικά σε άτομα με προβλήματα όρασης ό, τι φαίνεται σε αυτές.
Οι άνθρωποι με προβλήματα όρασης μπορούν να χρησιμοποιήσουν εξελιγμένο λογισμικό πλοήγησης για να χρησιμοποιούν υπολογιστές: το λογισμικό screenreader μετατρέπει ό,τι δείχνει η οθόνη σε ομιλία ή ακόμη και κώδικα Μπράιγ. Όμως μπορεί να «διαβάσει» μόνο κείμενο, όχι εικόνες.
Χρησιμοποιώντας όμως τεχνητή νοημοσύνη, οι σέρβερς του Facebook μπορούν τώρα να αποκωδικοποιήσουν και να περιγράψουν τις εικόνες που αποστέλλονται στο site και να τις μετατρέψουν με τρόπο που μπορούν να «διαβαστούν» από το ειδικό λογισμικό που απευθύνεται σε άτομα με προβλήματα όρασης.
Το Facebook υποστηρίζει ότι έχει πλέον «εκπαιδεύσει» το λογισμικό της να αναγνωρίζει περίπου 80 γνωστά αντικείμενα και δραστηριότητες και να προσθέτει τις περιγραφές ως εναλλακτικό κείμενο σε κάθε φωτογραφία. Όσο περισσότερες εικόνες σκανάρει, τόσο περισσότερο εξελιγμένο θα γίνεται το λογισμικό.
Ορισμένα από τα αντικείμενα που μπορεί να αναγνωρίσει είναι:
* Μεταφορές – αυτοκίνητα, πλοία, αεροπλάνα, ποδήλατα, τρένα, δρόμους, μοτοσικλέτες, λεωφορεία
* Περιβάλλον – εξωτερικούς χώρους, βουνά, δέντρα, χιόνι, τον ουρανό, ωκεανούς, νερά, παραλίες, κύματα, τον ήλιο, το γρασίδι
* Αθλητισμός – τένις, κολύμβηση, γήπεδα μπάσκετ, μπέιζμπολ, γκολφ
* Τρόφιμα – παγωτό, σούσι, πίτσα, γλυκά, καφέδες
* Εμφάνιση – μωρά, γυαλιά, γενειάδες, χαμόγελα, κοσμήματα, παπούτσια, selfies
Ο άνθρωπος πίσω από την ανάπτυξη του λογισμικού είναι ο Matt King, ένας μηχανικός λογισμικού του Facebook ο οποίος έχασε την όρασή του, λόγω μελαγχρωστικής αμφιβληστροειδοπάθειας – μια εκφυλιστική πάθηση που καταστρέφει τα ευαίσθητα στο φως κύτταρα του αμφιβληστροειδούς.
«Στο Facebook, πολλά από αυτό που συμβαίνουν είναι κατά κύριο λόγο οπτικά. Και, αν είστε τυφλός, μπορεί πραγματικά να νιώσετε ότι μένετε έξω από τη συζήτηση», δήλωσε.
Η τεχνολογία που έχουν αναπτύξει ο King και η ομάδα του χρησιμοποιεί το λογισμικό αναγνώρισης αντικειμένων του Facebook για να αποκρυπτογραφήσει τι περιέχει μια εικόνα. «Η τεχνητή μας νοημοσύνη έχει προχωρήσει σε τέτοιο βαθμό που μπορούμε να βάλουμε τους υπολογιστές να περιγράφουν τις εικόνες με κατανοητό τρόπο».
Το σύστημα προς το παρόν περιγράφει τις εικόνες με αρκετά βασικούς όρους, π.χ. «Υπάρχουν δύο άνθρωποι σε αυτή την εικόνα και χαμογελούν», είναι όμως προφανώς θέμα χρόνου μέχρι να αρχίσει να τα καταφέρνει πολύ καλύτερα.