Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Games
ΡΟΗ ΕΙΔΗΣΕΩΝ
Επιστήμη 02.02.2023 18:25

Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται

Image of Βασιλική Μιχοπούλου Βασιλική Μιχοπούλου
Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται Φωτογραφία: ΑΠΕ-ΜΠΕ
Το απόθεμα των γλωσσικών δεδομένων στα οποία εκπαιδεύεται η τεχνητή νοημοσύνη, όπως το ChatGPT, θα μπορούσε να εξαντληθεί έως το 2026, επειδή η ΑΙ τα καταναλώνει γρηγορότερα από ό,τι τα παράγουν οι άνθρωποι.

Η παροχή γλωσσικών δεδομένων υψηλής ποιότητας που χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης με μηχανική μάθηση μπορεί να εξαντληθεί σε τρία χρόνια, οδηγώντας την πρόοδο της τεχνητής νοημοσύνης σε στασιμότητα, διαπιστώνουν αμερικανοί ερευνητές.

Η μηχανική εκμάθηση εξουσιοδοτεί προγράμματα τεχνητής νοημοσύνης, όπως το Midjourney και το ChatGPT του OpenAI που βασίζεται σε συνομιλία. Τέτοια μοντέλα εκπαιδεύονται σε τεράστιες ομάδες δεδομένων που έχουν δημιουργηθεί από τον άνθρωπο στο Διαδίκτυο. Ωστόσο, σύμφωνα με μια ομάδα εμπειρογνωμόνων στη τεχνητή νοημοσύνη διαφαίνεται ένα πρόβλημα στον ορίζοντα: μπορεί να ξεμείνουμε από δεδομένα για να τα εκπαιδεύσουμε.

Τα γλωσσικά μοντέλα εκπαιδεύονται χρησιμοποιώντας κείμενα από πηγές όπως η Wikipedia, άρθρα ειδήσεων, επιστημονικές εργασίες και βιβλία. Η τάση τα τελευταία χρόνια ήταν αυτά τα μοντέλα να εκπαιδεύονται σε όλο και περισσότερα δεδομένα με την ελπίδα να καταστούν πιο ακριβή και ευέλικτα. Οι ερευνητές που δημιουργούν πιο ισχυρά μοντέλα με μεγαλύτερες δυνατότητες, πρέπει να βρουν όλο και περισσότερα κείμενα για να τα εκπαιδεύσουν και ανησυχούν ολοένα και περισσότερο ότι θα ξεμείνουν από αυτού του είδους τα δεδομένα.

Σύμφωνα με μια επιστημονική δημοσίευση ερευνητών από τον Epoch , έναν οργανισμό έρευνας και πρόβλεψης τεχνητής νοημοσύνης, το απόθεμα γλωσσικών δεδομένων αυξάνεται επί του παρόντος κατά 7% ετησίως, αλλά το μοντέλο τους προβλέπει επιβράδυνση στο 1% μέχρι το 2100. Το απόθεμα είναι αυτή τη στιγμή μεταξύ 7e13 και 7e16 λέξεων, το οποίο είναι κατά 1,5 έως 4,5 τάξεις μεγέθους μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων που χρησιμοποιούνται σήμερα. Με βάση αυτές τις τάσεις, πιθανότατα θα ξεμείνουμε από δεδομένα στο χρονικό διάστημα μεταξύ 2030 και 2050.

Σύμφωνα πάντα με τη δημοσίευση του Epoch, οι ερευνητές γλώσσας ΑΙ τεχνητής φιλτράρουν τα δεδομένα που χρησιμοποιούν για την εκπαίδευση μοντέλων σε δύο κατηγορίες, σε υψηλής και σε χαμηλής ποιότητας. Η γραμμή μεταξύ των δύο κατηγοριών μπορεί να είναι ασαφής, λέει ο Pablo Villalobos, ερευνητής του Epoch και ο κύριος συγγραφέας της μελέτης, ωστόσο το κείμενο από την πρώτη κατηγορία θεωρείται καλύτερα γραμμένο και συχνά παράγεται από επαγγελματίες συγγραφείς. Συγκριτικά με το μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων, το απόθεμα γλωσσικών δεδομένων υψηλής ποιότητας είναι μεταξύ 4,6e12 και 1,7e13 λέξεων, δηλαδή μικρότερο κατά μία τάξη μεγέθους. Είμαστε σε μια τάξη μεγέθους υψηλής ποιότητας δεδομένων με εξαντλητική τάση που πιθανότατα θα συμβεί μεταξύ 2023 και 2027.

ΟΙ ΕΙΔΗΣΕΙΣ ΣΕ 2'

Όσα πρέπει να ξέρετε
για να ξεκινήσετε τη μέρα σας.

* Με την εγγραφή σας στο newsletter του Dnews, αποδέχεστε τους σχετικούς όρους χρήσης

Τα δεδομένα από κατηγορίες χαμηλής ποιότητας αποτελούνται από κείμενα όπως αναρτήσεις μέσων κοινωνικής δικτύωσης ή σχόλια σε ιστότοπους όπως το 4chan, τα οποία υπερτερούν σε αριθμό εκείνων που θεωρούνται υψηλής ποιότητας. Οι ερευνητές συνήθως εκπαιδεύουν μοντέλα χρησιμοποιώντας μόνο δεδομένα που εμπίπτουν στην κατηγορία υψηλής ποιότητας, επειδή αυτός είναι ο τύπος γλώσσας που θέλουν να αναπαράγουν τα μοντέλα. Αυτή η προσέγγιση οδήγησε σε μερικά εντυπωσιακά αποτελέσματα για μεγάλα γλωσσικά μοντέλα όπως το GPT-3.

Αντίστοιχα, η μελλοντική ανάπτυξη των συνόλων δεδομένων εικόνων δείχνει να είναι μικρότερη, ωστόσο, ο ρυθμός ανάπτυξης φαίνεται να είναι περίπου 18% έως 31% ετησίως. Το απόθεμα δεδομένων όρασης αυξάνεται επί του παρόντος κατά 8% ετησίως, αλλά αναμένεται να επιβραδυνθεί στο 1% έως το 2100. Η προβολή αυτών των τάσεων υπογραμμίζει ότι οι εκπαιδευτές μοντέλων ΑΙ πιθανότατα θα τρέξουν δεδομένα εκτός όρασης μεταξύ 2030 και 2070

Ένας τρόπος για να ξεπεραστούν αυτοί οι περιορισμοί δεδομένων θα ήταν να επαναξιολογηθεί αυτό που ορίζεται ως «χαμηλή» και «υψηλή» ποιότητα, σύμφωνα με την Swabha Swayamdipta, καθηγήτρια μηχανικής μάθησης στο Πανεπιστήμιο της Νότιας Καλιφόρνια που ειδικεύεται στην ποιότητα των συνόλων δεδομένων. Εάν οι ελλείψεις δεδομένων ωθήσουν τους ερευνητές της τεχνητής νοημοσύνης να ενσωματώσουν πιο διαφορετικά σύνολα δεδομένων στη διαδικασία εκπαίδευσης, θα ήταν «καθαρά θετικό» για τα γλωσσικά μοντέλα, λέει η ίδια.

Οι ερευνητές μπορούν επίσης να βρουν τρόπους να παρατείνουν τη διάρκεια ζωής των δεδομένων που χρησιμοποιούνται για την εκπαίδευση γλωσσικών μοντέλων. Επί του παρόντος, αυτά τα μοντέλα εκπαιδεύονται με τα ίδια δεδομένα μόνο μία φορά, λόγω των περιορισμών απόδοσης και κόστους, αλλά μπορεί να είναι δυνατό να εκπαιδευτεί ένα μοντέλο πολλές φορές χρησιμοποιώντας τα ίδια δεδομένα, λέει η Swayamdipta.

Ο Percy Liang, καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο του Στάνφορντ, αντίθετα λέει ότι χρειάζεται να βελτιωθεί η ικανότητα των μοντέλων και όχι το μέγεθος για να γίνουν πιο αποτελεσματικά. «Είδαμε πώς τα μικρότερα μοντέλα που εκπαιδεύονται σε δεδομένα υψηλότερης ποιότητας μπορούν να ξεπεράσουν τα μεγαλύτερα μοντέλα που έχουν εκπαιδευτεί σε δεδομένα χαμηλότερης ποιότητας», εξηγεί.

Πηγή: MIT Technology Review

# TAGS

  • CHATBOTS
Δες όλες τις ειδήσεις και τα νέα τη στιγμή που συμβαίνουν
Πραγματική απειλή για την κυβέρνηση οι «γαλάζιοι» βουλευτές - Νέο πρόβλημα η κάλυψη Λαζαρίδη

Πραγματική απειλή για την κυβέρνηση οι «γαλάζιοι» βουλευτές - Νέο πρόβλημα η κάλυψη Λαζαρίδη

Συναγερμός στην Ευρώπη για έλλειψη αεροπορικών καυσίμων - Κίνδυνος ακυρώσεων πτήσεων το καλοκαίρι

Συναγερμός στην Ευρώπη για έλλειψη αεροπορικών καυσίμων - Κίνδυνος ακυρώσεων πτήσεων το καλοκαίρι

«Ασφυξία» στα νοικοκυριά: Τα ενοίκια «καταπίνουν» έως και το 90% του μισθού

«Ασφυξία» στα νοικοκυριά: Τα ενοίκια «καταπίνουν» έως και το 90% του μισθού

Πότε υποχωρεί η αφρικανική σκόνη - Πού θα πέσουν λασποβροχές σύμφωνα με τον Κλέαρχο Μαρουσάκη

Πότε υποχωρεί η αφρικανική σκόνη - Πού θα πέσουν λασποβροχές σύμφωνα με τον Κλέαρχο Μαρουσάκη

Κοινωνικός Τουρισμός 2026 - 2027: Οι νέες αλλαγές, οι δικαιούχοι και οι ευκαιρίες για περισσότερες διακοπές

Κοινωνικός Τουρισμός 2026 - 2027: Οι νέες αλλαγές, οι δικαιούχοι και οι ευκαιρίες για περισσότερες διακοπές

Στοίχημα: Ο Πλήρης Οδηγός για όσα πρέπει να γνωρίζεις πριν ξεκινήσεις

Στοίχημα: Ο Πλήρης Οδηγός για όσα πρέπει να γνωρίζεις πριν ξεκινήσεις

Fuel Pass 2026: Πώς να πάρεις το μέγιστο ποσό και extra 40€ καύσιμα

Fuel Pass 2026: Πώς να πάρεις το μέγιστο ποσό και extra 40€ καύσιμα

Μήπως αυτό που λείπει από το δέρμα σου δεν είναι άλλη μια κρέμα;

Μήπως αυτό που λείπει από το δέρμα σου δεν είναι άλλη μια κρέμα;

Whitepress: Η πλατφόρμα που φέρνει το παγκόσμιο Content Marketing και SEO στην ελληνική αγορά

Whitepress: Η πλατφόρμα που φέρνει το παγκόσμιο Content Marketing και SEO στην ελληνική αγορά

Ο δρόμος αλλάζει, αλλά γιατί δεν νιώθουμε πιο ασφαλείς;

Ο δρόμος αλλάζει, αλλά γιατί δεν νιώθουμε πιο ασφαλείς;

Η αύξηση του βάρος πριν τα 30 συνδέεται με αυξημένο κίνδυνο θανάτου

Η αύξηση του βάρος πριν τα 30 συνδέεται με αυξημένο κίνδυνο θανάτου

Κατάθλιψη στους γονείς: Μπορεί να επηρεάσει την ψυχολογία των παιδιών για δεκαετίες

Κατάθλιψη στους γονείς: Μπορεί να επηρεάσει την ψυχολογία των παιδιών για δεκαετίες

Διαβήτης τύπου 5: Τι είναι και ποιοι κινδυνεύουν

Διαβήτης τύπου 5: Τι είναι και ποιοι κινδυνεύουν

Περπάτημα: Πόσες εβδομάδες χρειάζονται για να νιώσετε τη διαφορά στην υγεία της καρδιάς σας

Περπάτημα: Πόσες εβδομάδες χρειάζονται για να νιώσετε τη διαφορά στην υγεία της καρδιάς σας

Συναγερμός στην Ευρώπη για έλλειψη αεροπορικών καυσίμων - Κίνδυνος ακυρώσεων πτήσεων το καλοκαίρι

Συναγερμός στην Ευρώπη για έλλειψη αεροπορικών καυσίμων - Κίνδυνος ακυρώσεων πτήσεων το καλοκαίρι

Τρεις έξυπνοι τρόποι για να μειώσετε δραστικά τον λογαριασμό του νερού

Τρεις έξυπνοι τρόποι για να μειώσετε δραστικά τον λογαριασμό του νερού

Πέντε συμβουλές για πιο αποτελεσματική χρήση του αφυγραντήρα σας

Πέντε συμβουλές για πιο αποτελεσματική χρήση του αφυγραντήρα σας

Πώς διαμορφώνονται οι τιμές καυσίμων ανά νομό -Η ακρίβεια περνά από την αντλία στο ράφι

Πώς διαμορφώνονται οι τιμές καυσίμων ανά νομό -Η ακρίβεια περνά από την αντλία στο ράφι

Η κρίση στη Μέση Ανατολή πυροδοτεί νέους κινδύνους για τις παγκόσμιες αγορές

Η κρίση στη Μέση Ανατολή πυροδοτεί νέους κινδύνους για τις παγκόσμιες αγορές

Έρχεται νέο «Ανακαινίζω» με επιδότηση ακόμη και 95%

Έρχεται νέο «Ανακαινίζω» με επιδότηση ακόμη και 95%

ΡΟΗ ΕΙΔΗΣΕΩΝ

Νέα βόμβα για το πτυχίο Λαζαρίδη: Ούτε βεβαίωση παρακολούθησης δεν μπορούσε να δώσει το δήθεν Κολέγιο

Παιδεία 20:18

«Παιχνίδια Εκδίκησης»: Η Μαρίνα και η Μάγια από αντίπαλες γίνονται σύμμαχοι

Life 20:12

Χάκαραν την Booking.com - Η εταιρεία προειδοποιεί τους πελατες για παραβίαση δεδομένων

Διεθνή 20:04

Έλλη Κοκκίνη: Η απάντηση σε ερώτηση για την Άννα Βίσση

Life 20:04

Ελεγκτικό Συνέδριο: 3,45 εκατ. ακίνητα χωρίς ταυτοποιημένο ιδιοκτήτη μετά από 30 χρόνια Κτηματολόγιο

Οικονομία 19:59

Σταθεροποιητική συνεδρίαση στο Χρηματιστήριο Αθηνών

Οικονομία 19:55
Όλες Οι Ειδήσεις

ΔΗΜΟΦΙΛΗ

Κοινό ανακοινωθέν Ισραήλ - Λιβάνου - ΗΠΑ: Διαπραγματεύσεις για ειρήνη και συμφωνία για πλήρη αφοπλισμό της Χεζμπολάχ

Διεθνή 22:50

Sky News: Πιθανές νέες συνομιλίες ΗΠΑ- Ιράν την επόμενη εβδομάδα, στο Πακιστάν

Διεθνή 17:13

Τζόκερ 14/4/2026: Κλήρωσε για πάνω από 4,7 εκατ., οι τυχεροί αριθμοί

Ελλάδα 22:04

Πρόεδρος ΔΟΕ για Λαζαρίδη: Πίσω από τα μεγάλα λόγια περί «αξιολόγησης» κρύβεται η επιβράβευση του ρουσφετιού

Παιδεία 21:49

Eurojackpot 14/4/26: Αυτοί είναι οι αριθμοί που κερδίζουν 14 εκατ. ευρώ

Ελλάδα 23:15
Ειδήσεις από την Περιφέρεια - σε συνεργασία με τα μεγαλύτερα ενημερωτικά μέσα της Περιφέρειας

# HOT TOPICS

  • ΚΑΙΡΟΣ
  • ΛΟΓΑΡΙΑΣΜΟΙ ΡΕΥΜΑΤΟΣ

ΤΙΜΕΣΠΡΟΪΟΝΤΩΝ ΕΝΕΡΓΕΙΑΣ

αναλύσεις & ρεπορτάζ
από την συντακτική ομάδα τουDnews

ΤΙΜΕΣ ΡΕΥΜΑ ΤΙΜΕΣ ΦΥΣ. ΑΕΡΙΟ

Σχετικά Άρθρα

Η Burger King θα ελέγχει με AI chatbot αν οι υπάλληλοι λένε «παρακαλώ» και «ευχαριστώ»

Η Burger King θα ελέγχει με AI chatbot αν οι υπάλληλοι λένε «παρακαλώ» και «ευχαριστώ»

Διεθνή 27.02.2026 09:53
Τα chatbots τεχνητής νοημοσύνης δεν είναι φίλοι σας, προειδοποιούν ειδικοί

Τα chatbots τεχνητής νοημοσύνης δεν είναι φίλοι σας, προειδοποιούν ειδικοί

Τεχνολογία 03.02.2026 09:41
Aγγελος - Eξάγγελος και η κολακεία του chatbot

Aγγελος - Eξάγγελος και η κολακεία του chatbot

Opinions 31.10.2025 06:27
Ποιο chatbot τεχνητής νοημοσύνης διαδίδει τις περισσότερες ψευδείς πληροφορίες; Λάθος 1 στις 3 απαντήσεις

Ποιο chatbot τεχνητής νοημοσύνης διαδίδει τις περισσότερες ψευδείς πληροφορίες; Λάθος 1 στις 3 απαντήσεις

Τεχνολογία 05.09.2025 14:05

NETWORK

Έως 270 δισ. κυβικά μέτρα οι εκτιμήσεις για τα αποθέματα φυσικού αερίου στο Ιόνιο

Έως 270 δισ. κυβικά μέτρα οι εκτιμήσεις για τα αποθέματα φυσικού αερίου στο Ιόνιο

ienergeia.gr 04.15.2026 - 14:48
Η αύξηση του βάρος πριν τα 30 συνδέεται με αυξημένο κίνδυνο θανάτου

Η αύξηση του βάρος πριν τα 30 συνδέεται με αυξημένο κίνδυνο θανάτου

healthstat.gr 04.15.2026 - 18:43
Περπάτημα: Πόσες εβδομάδες χρειάζονται για να νιώσετε τη διαφορά στην υγεία της καρδιάς σας

Περπάτημα: Πόσες εβδομάδες χρειάζονται για να νιώσετε τη διαφορά στην υγεία της καρδιάς σας

healthstat.gr 04.15.2026 - 17:55
Η MORE ολοκλήρωσε την κατασκευή τριών μονάδων αποθήκευσης ενέργειας

Η MORE ολοκλήρωσε την κατασκευή τριών μονάδων αποθήκευσης ενέργειας

ienergeia.gr 04.15.2026 - 15:10
Αλλαγή ηγεσίας στη Pfizer Hellas: Αποχωρεί μετά από σχεδόν 40 χρόνια επαγγελματικής πορείας ο Ζαχαρίας Ραγκούσης

Αλλαγή ηγεσίας στη Pfizer Hellas: Αποχωρεί μετά από σχεδόν 40 χρόνια επαγγελματικής πορείας ο Ζαχαρίας Ραγκούσης

healthstat.gr 04.15.2026 - 18:24
Κατάθλιψη στους γονείς: Μπορεί να επηρεάσει την ψυχολογία των παιδιών για δεκαετίες

Κατάθλιψη στους γονείς: Μπορεί να επηρεάσει την ψυχολογία των παιδιών για δεκαετίες

healthstat.gr 04.15.2026 - 19:39
Chiesi Hellas: Στη λίστα «The Most Sustainable Companies in Greece 2026»

Chiesi Hellas: Στη λίστα «The Most Sustainable Companies in Greece 2026»

ienergeia.gr 04.15.2026 - 15:43
Νέα αξιολογημένα προγράμματα κατάρτισης στο πρόγραμμα της ΔΥΠΑ για εργαζόμενους

Νέα αξιολογημένα προγράμματα κατάρτισης στο πρόγραμμα της ΔΥΠΑ για εργαζόμενους

ienergeia.gr 04.15.2026 - 15:27
Dnews

ΟΠΙΝΙΟΝ ΠΟΣΤ ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ Α.Ε. "OPINIONPOST" Διεύθυνση: Ιπποκράτους 2, Αθήνα, 10679, Ελλάδα
ΑΦΜ: 800961697 - ΔΟΥ: ΚΕΦΟΔΕ Αττικής
ΑΡ. ΓΕΜΗ: 145803601000
Τηλ: 210 3608484
E-mail: info@dnews.gr

Domain name: Dnews.gr (Dikaiologitika.gr)
Νόμιμος Εκπρόσωπος - Διευθύνων Σύμβουλος: Νίκος Ανδριόπουλος (andriopoulos@opinion-post.gr)
Ιδιοκτησία: OPINIONPOST A.E. - Μέτοχοι: ENERGY REGISTER Α.Ε. / Ανδριόπουλος Νικόλαος
Δικαιούχος Domain: OPINIONPOST A.E. - Διαχειριστής Domain: Σωτήρης Μπέσκος
Διευθυντής Ιστοσελίδας: Παναγιώτης Ευθυμιάδης
Διευθυντής Σύνταξης: Κώστας Σαρρηκώστας

  • ΤΑΥΤΟΤΗΤΑ
  • ΔΙΑΦΗΜΙΣΗ
  • ΟΡΟΙ ΧΡΗΣΗΣ
  • ΠΟΛΙΤΙΚΗ ΠΡΟΣΤΑΣΙΑΣ ΔΕΔΟΜΕΝΩΝ
  • ΠΟΛΙΤΙΚΗ ΑΠΟΡΡΗΤΟΥ
  • COOKIES
  • ΚΩΔΙΚΑΣ ΔΕΟΝΤΟΛΟΓΙΑΣ
  • ΟΛΕΣ ΟΙ ΕΙΔΗΣΕΙΣ
Μέλος ΕΝΕΔ

Copyright © 2011 - 2026 OpinionPost S.A. All rights reserved.

Developed by Nuevvo.

ΜΕΛΟΣ #242054 Μ.Η.Τ. Μέλος #242054 του Μ.Η.Τ.
  • Πολιτική
  • Οικονομία
  • Ελλάδα
  • Διεθνή
  • Life
  • Παιδεία
  • Υγεία
  • Αθλητισμός
  • Επιστήμη
  • Επιχειρήσεις
  • Θέσεις Εργασίας
  • Ο Πληροφοριοδότης
  • Παιχνίδια Εξουσίας
  • Τεχνολογία
  • Auto - Moto
  • Entertainment
  • Market Maven
  • News In English
  • Opinions
  • Ειδήσεις Από Την Περιφέρεια
  • Όλες οι Ειδήσεις
Games