Ποια είναι η κορυφαία γλώσσα για εποικοινωνία με την Τεχνητή Νοημοσύνη

Ποια είναι η κορυφαία γλώσσα για εποικοινωνία με την Τεχνητή Νοημοσύνη
Photo: Unsplash

Νέα διεθνής μελέτη του Πανεπιστημίου του Μέριλαντ και της Microsoft αποκαλύπτει ποια είναι η γλώσσα με ακρίβεια 88% σε σύνθετες εργασίες, αφήνοντας πίσω τα αγγλικά, τα κινεζικά και άλλες «μεγάλες» γλώσσες.

  • Στις δοκιμές 26 γλωσσών σε κορυφαία μεγάλα γλωσσικά μοντέλα, η δεκάδα με την καλύτερη επίδοση περιλαμβάνει κατά σειρά τα πολωνικά, γαλλικά, ιταλικά, ισπανικά, ρωσικά.
  • Οι ερευνητές αποδίδουν τα αποτελέσματα σε συνδυασμό παραγόντων, όπως η γλωσσική οικογένεια, το λατινικό/κυριλλικό αλφάβητο, η διαθεσιμότητα δεδομένων εκπαίδευσης και ο τρόπος που τα μοντέλα «τεμαχίζουν» το κείμενο σε tokens.
  • Τα ευρήματα έχουν πρακτικές συνέπειες για κυβερνήσεις, επιχειρήσεις και developers.

Η πολωνική γλώσσα αναδεικνύεται, σύμφωνα με νέα διεθνή μελέτη, ως η πιο αποτελεσματική για «προτροπές» (prompts) προς συστήματα Τεχνητής Νοημοσύνης, ξεπερνώντας ακόμη και την αγγλική, η οποία θεωρείται η de facto γλώσσα του ψηφιακού κόσμου.

Μια ερευνητική ομάδα από το Πανεπιστήμιο του Μέριλαντ και τη Microsoft δοκίμασε κορυφαία μεγάλα γλωσσικά μοντέλα (όπως αυτά που αναπτύσσουν OpenAI, Google Gemini, Qwen, Llama, DeepSeek) σε 26 διαφορετικές γλώσσες, δίνοντάς τους ακριβώς τα ίδια, σύνθετα prompts και αξιολογώντας την ικανότητά τους να επεξεργάζονται μεγάλα κείμενα, να εντοπίζουν κρίσιμες πληροφορίες («needle‑in‑a‑haystack» τεστ), να συνοψίζουν και να απαντούν με ακρίβεια. Τα πολωνικά πέτυχαν μέσο ποσοστό επιτυχίας 88%, το υψηλότερο μεταξύ όλων των γλωσσών που εξετάστηκαν, ενώ η αγγλική γλώσσα βρέθηκε στην 6η θέση με περίπου 83,9% και τα κινεζικά στις τελευταίες θέσεις, γύρω στο 62%.

Ιδιαίτερη σημασία έχει ότι η πολωνική θεωρείται «δύσκολη» για τους ανθρώπους, αλλά τα μοντέλα ΤΝ φαίνεται να την επεξεργάζονται με εντυπωσιακή ευχέρεια, παρά το γεγονός ότι ο όγκος πολωνόφωνων δεδομένων εκπαίδευσης είναι σαφώς μικρότερος σε σχέση με τα αγγλικά ή τα κινεζικά. Στην πρώτη δεκάδα των πιο «αποτελεσματικών» γλωσσών για συνομιλιακή ΤΝ περιλαμβάνονται (μετά τα πολωνικά) τα γαλλικά, ιταλικά, ισπανικά, ρωσικά, αγγλικά, ουκρανικά, πορτογαλικά, γερμανικά και ολλανδικά, με τους ερευνητές να επισημαίνουν ότι γλωσσικές οικογένειες όπως οι σλαβικές, οι λατινογενείς και οι γερμανικές –που χρησιμοποιούν λατινικό ή κυριλλικό αλφάβητο και διαθέτουν πλούσια ψηφιακά corpora– τείνουν να αποδίδουν καλύτερα.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Η μελέτη ερμηνεύει τις αποκλίσεις απόδοσης μέσα από παράγοντες όπως η διαθεσιμότητα δεδομένων εκπαίδευσης για κάθε γλώσσα, ο τύπος γραφής (script), η γλωσσική οικογένεια και ο τρόπος που «κόβεται» το κείμενο σε tokens από τα μοντέλα.

Ταυτόχρονα, η ανάδειξη της πολωνικής έχει και γεωπολιτική–τεχνολογική διάσταση, καθώς συνδέεται με την στρατηγική επένδυση της Πολωνίας σε δικά της μεγάλα γλωσσικά μοντέλα (όπως το PLLuM) και σε δημόσιες υποδομές ΤΝ για τη γλώσσα.

Οι 10 πιο αποτελεσματικές γλώσσες για επικοινωνία με την ΤΝ:

  • Πολωνικά 88%
  • Γαλλικά 87%
  • Ιταλικά 86%
  • Ισπανικά 85%
  • Ρωσικά 84%
  • Αγγλικά 83,9%
  • Ουκρανικά 83,5%
  • Πορτογαλικά 82%
  • Γερμανικά 81%
  • Ολλανδικά 80%

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: Euronews.com