Συνέντευξη με τον Γιώργο Κουμανταρή, Διευθύνοντα Σύμβουλο και Ιδρυτή της Εταιρείας
Πώς γεννήθηκε η τεχνολογική ανακάλυψη της Aseto AI;
Όταν η ομάδα της Aseto AI ξεκίνησε να εργάζεται στη φωνητική τεχνολογία και την αυτοματοποίηση ενεργειών μέσω φωνής, διαπίστωσε ένα κρίσιμο κενό. Τα αγγλόφωνα μοντέλα ΤΝ, παρότι ιδιαίτερα εξελιγμένα, αποτύγχαναν όταν εφάρμοζαν τα σενάριά τους στα ελληνικά και κυρίως στην κυπριακή διάλεκτο. Η αναγνώριση αριθμών, τοποθεσιών, ιδιωμάτων και καθημερινών εκφράσεων γινόταν με χαμηλή ακρίβεια. Ένα χαρακτηριστικό παράδειγμα ήταν το κυπριακό «κοσίδκιο» για τον αριθμό «είκοσι δύο», το οποίο τα συστήματα δεν μπορούσαν να αντιληφθούν σωστά.
Η απουσία τεχνολογιών που να κατανοούν φυσικά τη γλωσσική ποικιλία οδήγησε την Aseto AI στην ανάπτυξη δικών της μοντέλων μέσω fine-tuning ανοιχτού κώδικα. Εκπαιδεύοντάς τα σε ελληνικές και κυπριακές εκφωνήσεις, προφορές και τοπικές ιδιαιτερότητες, η ομάδα πέτυχε σημαντική αύξηση στην ακρίβεια μετατροπής ομιλίας σε κείμενο (Speech-to-Text). Έτσι, άνοιξε ο δρόμος για πραγματικά αξιόπιστη αυτοματοποίηση φωνητικών ενεργειών στα ελληνικά.
Ποιες ήταν οι μεγαλύτερες προκλήσεις;
Η δυσκολία δεν ήταν μόνο τεχνική, αλλά και θεμελιώδης: δεν υπήρχαν επαρκή ελληνόφωνα datasets ούτε καθιερωμένες μεθοδολογίες για την εκπαίδευση μοντέλων STT στην ελληνική και κυπριακή γλωσσική πραγματικότητα.
Η ομάδα ξεκίνησε πρακτικά από το μηδέν. Δημιούργησε στοχευμένα δείγματα ήχου από ομιλητές διαφορετικών ηλικιών, προφορών και περιβαλλόντων, ενώ επένδυσε ιδιαίτερα στη σωστή επισημείωση του υλικού.
Ο στόχος δεν ήταν απλώς ένα μοντέλο που «αναγνωρίζει» ελληνικά, αλλά ένα μοντέλο που προσθέτει γλωσσική ικανότητα χωρίς να χάνει την υψηλή απόδοση που είχε όταν λειτουργούσε στα αγγλικά. Μια λεπτή ισορροπία που απαιτούσε πειστικές δοκιμές, επανάληψη και προσεκτικό σχεδιασμό της διαδικασίας εκπαίδευσης.
Πώς καταφέρατε να κάνετε την ΤΝ να “καταλαβαίνει” ελληνικά και κυπριακά;
Η λύση προήλθε από στοχευμένο fine-tuning και τη δημιουργία εξειδικευμένων datasets που εστίαζαν στα σημεία όπου τα διεθνή μοντέλα αποτύγχαναν περισσότερο: αριθμοί, οδωνύμια, ιδιωτισμοί, ιδιωματικές προφορές. Μέσα από επαναληπτικούς κύκλους εκπαίδευσης και βελτίωσης, η Aseto AI κατάφερε να δημιουργήσει ένα σύστημα που κατανοεί όχι μόνο τη δομή της ελληνικής γλώσσας αλλά και τον τρόπο που μιλιέται στην καθημερινότητα. Το σύστημα μπορεί πλέον να αποδώσει με μεγάλη ακρίβεια ακόμη και δύσκολες κυπριακές εκφωνήσεις, διατηρώντας παράλληλα υψηλές επιδόσεις και σε άλλες γλώσσες.
Πού βρίσκει εφαρμογή αυτή η τεχνολογία;
Οι πρακτικές εφαρμογές είναι ήδη πολλές και αναπτύσσονται συνεχώς. Ένα από τα σημαντικότερα παραδείγματα είναι ο ψηφιακός βοηθός (AI digital secretary), που απαντά τηλεφωνικές κλήσεις με φυσική ομιλία και αλληλεπίδραση, οργανώνει ραντεβού, δίνει πληροφορίες, προωθεί αιτήματα και λειτουργεί χωρίς αναμονή.
Η τεχνολογία αυτή έχει τεράστια αξία για τον δημόσιο τομέα, όπου οι αναπάντητες κλήσεις αποτελούν χρόνιο πρόβλημα. Ο ψηφιακός βοηθός απαντά πάντα, αναγνωρίζει το αίτημα του πολίτη και το διαχειρίζεται ή το προωθεί σε άνθρωπο όπου χρειάζεται. Παράλληλα, προσφέρει πολύτιμη στατιστική ανάλυση: πόσες κλήσεις εξυπηρετήθηκαν, πόσες αυτόματα, ποια ήταν τα συνηθέστερα αιτήματα, πόσο μειώθηκε ο χρόνος αναμονής.
Επιπλέον, η τεχνολογία υποστηρίζει εξερχόμενες ενέργειες, όπως υπενθυμίσεις, ενημερώσεις και έρευνες ικανοποίησης, καθώς και αυτόματες μεταγραφές συναντήσεων στα ελληνικά – δυνατότητα που μέχρι πρόσφατα δεν προσφερόταν με υψηλή ποιότητα από διεθνείς πλατφόρμες.
Πώς ενισχύεται η παραγωγικότητα και ο ψηφιακός μετασχηματισμός;
Η λύση της Aseto AI αυτοματοποιεί διαδικασίες που απαιτούσαν σημαντικό χρόνο και ανθρώπινο δυναμικό. Επιχειρήσεις και οργανισμοί αποκτούν τη δυνατότητα να εξυπηρετούν περισσότερους πολίτες ή πελάτες γρηγορότερα, χωρίς αύξηση κόστους. Ταυτόχρονα, η ΤΝ που «μιλά» τη φυσική γλώσσα καθιστά την τεχνολογία πιο προσιτή και ανθρωποκεντρική. Δεν αλλάζει τον άνθρωπο – τον ενισχύει.
Ποια είναι τα επόμενα βήματα της Aseto AI;
Η εταιρεία εργάζεται ήδη στην ανάπτυξη ενός Text-to-Speech ελληνόφωνου μοντέλου, με στόχο να παράγειφωνή που ακούγεται φυσική, ζεστή και ανθρώπινη. Παράλληλα, δημιουργεί νέες λύσεις ΤΝ για την υποστήριξηεπιχειρησιακών λειτουργιών και την αντιμετώπιση καθημερινών προκλήσεων.
Η αποστολή της Aseto AI είναι ξεκάθαρη: να κάνει την Τεχνητή Νοημοσύνη ουσιαστικό εργαλείο σκέψης, λειτουργίας και εξέλιξης για την κοινωνία και τις επιχειρήσεις. Μετά την επιτυχία της στην ελληνόφωνη αναγνώριση ομιλίας, ανοίγει ο δρόμος για μια νέα εποχή τεχνολογίας που τιμά και ενσωματώνει τη γλώσσα και την κουλτούρα μας.
[email protected]
Aseto AI: Ο Ψηφιακός Βοηθός – Al Digital Secretary
Η Aseto AI, μια εταιρεία τεχνολογίας, αντιμετώπισε σημαντικές προκλήσεις στην ανάπτυξη συστημάτων αναγνώρισης ομιλίας για την ελληνική γλώσσα, ιδιαίτερα την κυπριακή διάλεκτο. Τα υπάρχοντα αγγλόφωνα μοντέλα Τεχνητής Νοημοσύνης (ΤΝ) αποτύγχαναν να αναγνωρίσουν με ακρίβεια ιδιωματισμούς, αριθμούς και τοπικές εκφράσεις, όπως το κυπριακό «κοσίδκιο» για το «είκοσι δύο». Για να ξεπεραστεί αυτό το εμπόδιο, η Aseto AI ανέπτυξε δικά της μοντέλα μέσω της τεχνικής του fine-tuning, χρησιμοποιώντας μεγάλο όγκο δεδομένων ελληνικής και κυπριακής ομιλίας. Αυτή η προσέγγιση επέτρεψε στα μοντέλα να κατανοήσουν τις γλωσσικές ιδιαιτερότητες και να βελτιώσουν σημαντικά την ακρίβεια της μετατροπής ομιλίας σε κείμενο. Η έλλειψη επαρκών ελληνόφωνων datasets και καθιερωμένων μεθοδολογιών αποτέλεσε μια από τις μεγαλύτερες δυσκολίες που αντιμετώπισε η ομάδα. Η επιτυχία της Aseto AI οδήγησε στη δημιουργία ενός ψηφιακού βοηθού (AI digital secretary) που μπορεί να απαντά σε τηλεφωνικές κλήσεις, να οργανώνει ραντεβού και να παρέχει πληροφορίες στα ελληνικά, προσφέροντας μια λύση για τον δημόσιο και ιδιωτικό τομέα.
You Might Also Like
Aseto AI: Ο ψηφιακός βοηθός -AI digital secretary- άπαντα τηλεφωνικές κλήσεις στην ελληνική γλώσσα και κυπριακή διάλεκτο
Nov 30
Ο Αλγόριθμος στο πιάτο μας: Η βιομηχανία τροφίμων στην εποχή της AI - Η μελέτη Ελληνίδας φοιτήτριας
Dec 1
Ο άνθρωπος πίσω από την εκτόξευση του YouTube
Dec 11
Συραγώ Τσιάρα: Το μίνιμουμ για ένα μουσείο είναι να συνδυάζει γνώση, απόλαυση και αναστοχασμό
Dec 12