Για πολλά χρόνια, η υπόσχεση για τη ριζική βελτίωση των φωτογραφιών στα smartphones μέσω της Τεχνητής Νοημοσύνης (AI) παρέμενε σε μεγάλο βαθμό θεωρητική ή περιοριζόταν σε τεχνητά «φιλτραρίσματα» που αλλοίωναν το αποτέλεσμα. Σήμερα, η Glass Imaging αποδεικνύει ότι η τεχνολογία της είναι επιτέλους έτοιμη να αλλάξει τους κανόνες του παιχνιδιού. Η επαναστατική τεχνολογία GlassAI Neural ISP (Νευρωνικός Επεξεργαστής Σήματος Εικόνας) ενσωματώνεται επίσημα στο ολοκαίνουριο smartphone Honor 600, υπόσχοντας να αναβαθμίσει θεαματικά την εμπειρία της φωτογράφισης με ζουμ.
Όπως αναφέρει εκτενές ρεπορτάζ του PetaPixel, η Glass Imaging καταφέρνει να ξεπεράσει τους ανυπέρβλητους, μέχρι πρότινος, περιορισμούς των μικροσκοπικών αισθητήρων και των λεπτών φακών που χρησιμοποιούν τα σύγχρονα κινητά τηλέφωνα.
Τι ακριβώς κάνει η Glass Imaging;
Ο πρωταρχικός στόχος της εταιρείας με έδρα την Καλιφόρνια είναι η χρήση εξελιγμένων αλγορίθμων και βαθιάς μηχανικής μάθησης για τη δραματική βελτίωση της ποιότητας της εικόνας από μικρούς αισθητήρες. Εκμεταλλευόμενη την υπολογιστική ισχύ των σύγχρονων επεξεργαστών, η τεχνολογία GlassAI αναλαμβάνει να «ανακτήσει» τις λεπτομέρειες, να μειώσει τον ψηφιακό θόρυβο και να διατηρήσει τα φυσικά χρώματα και τις υφές σε όλο το εύρος του ψηφιακού ζουμ.
Στην περίπτωση του Honor 600, η τεχνολογία αυτή αντικαθιστά ουσιαστικά την ανάγκη για έναν αυτόνομο, ογκώδη τηλεφακό. Αντί για έναν πρόσθετο φακό, η συσκευή πραγματοποιεί crop (περικοπή) στο κέντρο του πανίσχυρου κύριου αισθητήρα των 200 Megapixels, αφήνοντας το GlassAI να διορθώσει τις ατέλειες.
Η μάχη με τα μικροσκοπικά pixels και τους νόμους της φυσικής
Όταν οι κατασκευαστές προσπαθούν να στριμώξουν 200 εκατομμύρια εικονοστοιχεία σε έναν μικροσκοπικό αισθητήρα smartphone, το μέγεθος του κάθε pixel συρρικνώνεται σε υπο-μικρομετρικά επίπεδα (sub-micron). Στο Honor 600, τα εγγενή pixels έχουν μέγεθος μόλις 0,56 μm.
Όπως εξηγεί ο Shivansh Rao από την ομάδα μηχανικής μάθησης της Glass Imaging:
«Τα sub-micron pixels κωδικοποιούν τα δεδομένα υψηλής συχνότητας με εξαιρετικά περίπλοκους τρόπους, τους οποίους οι παραδοσιακοί επεξεργαστές εικόνας (ISPs) αδυνατούν να αποκωδικοποιήσουν. Η πληροφορία δεν χάνεται, απλώς είναι απίστευτα δύσκολο να ανακτηθεί. Μοντελοποιώντας τη συγκεκριμένη Συνάρτηση Διασποράς Σημείου (Point Spread Function – PSF), τον αισθητήρα και το προφίλ θορύβου του κάθε φακού, το GlassAI διορθώνει τις οπτικές αλλοιώσεις απευθείας στην πηγή τους, αντί να βασίζεται σε γενικές προσεγγίσεις».
Όταν ένας σχεδιαστής μεγαλώνει το διάφραγμα του φακού για να αντιμετωπίσει τη διάθλαση του φωτός στα μικρά pixels, εισάγει αναπόφευκτα γεωμετρικές εκτροπές (blur) στις άκρες του φακού. Ένας συμβατικός επεξεργαστής εικόνας απλώς προσπαθεί να εξομαλύνει ή να οξύρει τεχνητά αυτό το θόλωμα. Το GlassAI, γνωρίζοντας τη φυσική του συγκεκριμένου φακού, «ξετυλίγει» το θόλωμα και επαναφέρει την πραγματική πληροφορία.
End-to-End επεξεργασία σε αρχεία RAW: Γιατί διαφέρει από την κλασική AI
Οι φωτογράφοι είναι δικαιολογημένα καχύποπτοι με οτιδήποτε περιλαμβάνει τον όρο “AI” στις κάμερες των κινητών, καθώς πολλές συσκευές τείνουν να «εφευρίσκουν» ανύπαρκτες λεπτομέρειες (όπως το να επικολλούν μια έτοιμη φωτογραφία του φεγγαριού πάνω σε ένα θολό λευκό κύκλο).
Η Glass Imaging διαφοροποιείται πλήρως από αυτή την πρακτική, καθώς το μοντέλο της βασίζεται αποκλειστικά στα πραγματικά RAW δεδομένα που καταγράφει ο αισθητήρας:
-
Παράλληλη επεξεργασία: Ένας παραδοσιακός ISP εκτελεί την απομωσαϊκοποίηση (demosaicing), τη μείωση θορύβου (denoising) και την ευκρίνεια ως μια αλυσίδα ξεχωριστών, διαδοχικών βημάτων. Κάθε βήμα απορρίπτει δεδομένα που τα επόμενα στάδια δεν μπορούν να βρουν ποτέ.
-
Μηδενική απώλεια: Το GlassAI εκπαιδεύεται end-to-end, εκτελώντας όλες αυτές τις διαδικασίες ταυτόχρονα στο αρχικό RAW αρχείο, αποτρέποντας τη συσσωρευτική απώλεια πληροφοριών.
Το αποτέλεσμα αποφεύγει την υπερβολικά τονισμένη, τεχνητή ή «πλαστική» εμφάνιση (“AI-cleaned look”), παραμένοντας πιστό σε αυτό που βρισκόταν πραγματικά μπροστά από τον φακό.
Εντυπωσιακά αποτελέσματα στις δοκιμές
Σε ελεγχόμενες εργαστηριακές δοκιμές και συγκρίσεις της Glass Imaging, η νευρωνική αποκατάσταση βελτίωσε την ανάλυση εικόνας (MTF50) κατά περισσότερο από 50% καθώς τα pixels συρρικνώνονταν, την ίδια στιγμή που οι παραδοσιακοί ISPs εμφάνιζαν πλήρη στασιμότητα.
Σε δοκιμές με διαγράμματα κειμένου μικτής γραφής (Λατινικοί και Ασιατικοί χαρακτήρες), το αποτέλεσμα των παραδοσιακών επεξεργαστών ήταν εντελώς δυσανάγνωστο λόγω σφαλμάτων χρωματικής εκτροπής, ενώ το GlassAI απέδωσε πεντακάθαρο, ευανάγνωστο κείμενο. Το ίδιο συνέβη και σε πυκνά μοτίβα συγκλινουσών γραμμών, όπου εξαλείφθηκαν πλήρως τα ενοχλητικά φαινόμενα Μουαρέ (moiré).
Επέκταση πέρα από τα smartphones
Αν και το Honor 600 αποτελεί την πρώτη εμπορική βιτρίνα της τεχνολογίας, η Glass Imaging ξεκαθαρίζει ότι αυτό είναι μόνο η αρχή. Καθώς η βιομηχανία προσεγγίζει αυτό που οι μηχανικοί ονομάζουν «το τείχος της φυσικής των τηλεφακών» (όπου οι συμβατικοί φακοί δεν μπορούν να μικρύνουν άλλο), το λογισμικό θα είναι αυτό που θα δώσει τη λύση.
Η αρχιτεκτονική του GlassAI μπορεί να εφαρμοστεί με εξαιρετικά αποτελέσματα σε οποιοδήποτε σύστημα κάμερας περιορίζεται από το μέγεθος του αισθητήρα του, ανοίγοντας τον δρόμο για τεράστιες αναβαθμίσεις σε συσκευές wearables (smartwatches, έξυπνα γυαλιά), drones, στην αυτοκινητοβιομηχανία (κάμερες ασφαλείας οχημάτων), καθώς και σε ιατρικά διαγνωστικά εργαλεία.
Λίγο περισσότερο από μια 10ετία σε επίσημα service, έχοντας επισκευάσει μερικές… χιλιάδες τηλέφωνα, από την εποχή που δεν ήταν ακόμα “smartphones”. Βρήκα περισσότερο ενδιαφέρον στη δοκιμή τους, την δημιουργία αναλυτικών reviews και video για κάθε ένα από αυτά! Gaming και οδήγηση οι αγάπες μου εκτός του χώρου της τεχνολογίας