Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Games
ΡΟΗ ΕΙΔΗΣΕΩΝ
Επιστήμη 02.02.2023 18:25

Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται

Image of Βασιλική Μιχοπούλου Βασιλική Μιχοπούλου
Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται Φωτογραφία: ΑΠΕ-ΜΠΕ
Το απόθεμα των γλωσσικών δεδομένων στα οποία εκπαιδεύεται η τεχνητή νοημοσύνη, όπως το ChatGPT, θα μπορούσε να εξαντληθεί έως το 2026, επειδή η ΑΙ τα καταναλώνει γρηγορότερα από ό,τι τα παράγουν οι άνθρωποι.

Η παροχή γλωσσικών δεδομένων υψηλής ποιότητας που χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης με μηχανική μάθηση μπορεί να εξαντληθεί σε τρία χρόνια, οδηγώντας την πρόοδο της τεχνητής νοημοσύνης σε στασιμότητα, διαπιστώνουν αμερικανοί ερευνητές.

Η μηχανική εκμάθηση εξουσιοδοτεί προγράμματα τεχνητής νοημοσύνης, όπως το Midjourney και το ChatGPT του OpenAI που βασίζεται σε συνομιλία. Τέτοια μοντέλα εκπαιδεύονται σε τεράστιες ομάδες δεδομένων που έχουν δημιουργηθεί από τον άνθρωπο στο Διαδίκτυο. Ωστόσο, σύμφωνα με μια ομάδα εμπειρογνωμόνων στη τεχνητή νοημοσύνη διαφαίνεται ένα πρόβλημα στον ορίζοντα: μπορεί να ξεμείνουμε από δεδομένα για να τα εκπαιδεύσουμε.

Τα γλωσσικά μοντέλα εκπαιδεύονται χρησιμοποιώντας κείμενα από πηγές όπως η Wikipedia, άρθρα ειδήσεων, επιστημονικές εργασίες και βιβλία. Η τάση τα τελευταία χρόνια ήταν αυτά τα μοντέλα να εκπαιδεύονται σε όλο και περισσότερα δεδομένα με την ελπίδα να καταστούν πιο ακριβή και ευέλικτα. Οι ερευνητές που δημιουργούν πιο ισχυρά μοντέλα με μεγαλύτερες δυνατότητες, πρέπει να βρουν όλο και περισσότερα κείμενα για να τα εκπαιδεύσουν και ανησυχούν ολοένα και περισσότερο ότι θα ξεμείνουν από αυτού του είδους τα δεδομένα.

Σύμφωνα με μια επιστημονική δημοσίευση ερευνητών από τον Epoch , έναν οργανισμό έρευνας και πρόβλεψης τεχνητής νοημοσύνης, το απόθεμα γλωσσικών δεδομένων αυξάνεται επί του παρόντος κατά 7% ετησίως, αλλά το μοντέλο τους προβλέπει επιβράδυνση στο 1% μέχρι το 2100. Το απόθεμα είναι αυτή τη στιγμή μεταξύ 7e13 και 7e16 λέξεων, το οποίο είναι κατά 1,5 έως 4,5 τάξεις μεγέθους μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων που χρησιμοποιούνται σήμερα. Με βάση αυτές τις τάσεις, πιθανότατα θα ξεμείνουμε από δεδομένα στο χρονικό διάστημα μεταξύ 2030 και 2050.

Σύμφωνα πάντα με τη δημοσίευση του Epoch, οι ερευνητές γλώσσας ΑΙ τεχνητής φιλτράρουν τα δεδομένα που χρησιμοποιούν για την εκπαίδευση μοντέλων σε δύο κατηγορίες, σε υψηλής και σε χαμηλής ποιότητας. Η γραμμή μεταξύ των δύο κατηγοριών μπορεί να είναι ασαφής, λέει ο Pablo Villalobos, ερευνητής του Epoch και ο κύριος συγγραφέας της μελέτης, ωστόσο το κείμενο από την πρώτη κατηγορία θεωρείται καλύτερα γραμμένο και συχνά παράγεται από επαγγελματίες συγγραφείς. Συγκριτικά με το μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων, το απόθεμα γλωσσικών δεδομένων υψηλής ποιότητας είναι μεταξύ 4,6e12 και 1,7e13 λέξεων, δηλαδή μικρότερο κατά μία τάξη μεγέθους. Είμαστε σε μια τάξη μεγέθους υψηλής ποιότητας δεδομένων με εξαντλητική τάση που πιθανότατα θα συμβεί μεταξύ 2023 και 2027.

ΟΙ ΕΙΔΗΣΕΙΣ ΣΕ 2'

Όσα πρέπει να ξέρετε
για να ξεκινήσετε τη μέρα σας.

* Με την εγγραφή σας στο newsletter του Dnews, αποδέχεστε τους σχετικούς όρους χρήσης

Τα δεδομένα από κατηγορίες χαμηλής ποιότητας αποτελούνται από κείμενα όπως αναρτήσεις μέσων κοινωνικής δικτύωσης ή σχόλια σε ιστότοπους όπως το 4chan, τα οποία υπερτερούν σε αριθμό εκείνων που θεωρούνται υψηλής ποιότητας. Οι ερευνητές συνήθως εκπαιδεύουν μοντέλα χρησιμοποιώντας μόνο δεδομένα που εμπίπτουν στην κατηγορία υψηλής ποιότητας, επειδή αυτός είναι ο τύπος γλώσσας που θέλουν να αναπαράγουν τα μοντέλα. Αυτή η προσέγγιση οδήγησε σε μερικά εντυπωσιακά αποτελέσματα για μεγάλα γλωσσικά μοντέλα όπως το GPT-3.

Αντίστοιχα, η μελλοντική ανάπτυξη των συνόλων δεδομένων εικόνων δείχνει να είναι μικρότερη, ωστόσο, ο ρυθμός ανάπτυξης φαίνεται να είναι περίπου 18% έως 31% ετησίως. Το απόθεμα δεδομένων όρασης αυξάνεται επί του παρόντος κατά 8% ετησίως, αλλά αναμένεται να επιβραδυνθεί στο 1% έως το 2100. Η προβολή αυτών των τάσεων υπογραμμίζει ότι οι εκπαιδευτές μοντέλων ΑΙ πιθανότατα θα τρέξουν δεδομένα εκτός όρασης μεταξύ 2030 και 2070

Ένας τρόπος για να ξεπεραστούν αυτοί οι περιορισμοί δεδομένων θα ήταν να επαναξιολογηθεί αυτό που ορίζεται ως «χαμηλή» και «υψηλή» ποιότητα, σύμφωνα με την Swabha Swayamdipta, καθηγήτρια μηχανικής μάθησης στο Πανεπιστήμιο της Νότιας Καλιφόρνια που ειδικεύεται στην ποιότητα των συνόλων δεδομένων. Εάν οι ελλείψεις δεδομένων ωθήσουν τους ερευνητές της τεχνητής νοημοσύνης να ενσωματώσουν πιο διαφορετικά σύνολα δεδομένων στη διαδικασία εκπαίδευσης, θα ήταν «καθαρά θετικό» για τα γλωσσικά μοντέλα, λέει η ίδια.

Οι ερευνητές μπορούν επίσης να βρουν τρόπους να παρατείνουν τη διάρκεια ζωής των δεδομένων που χρησιμοποιούνται για την εκπαίδευση γλωσσικών μοντέλων. Επί του παρόντος, αυτά τα μοντέλα εκπαιδεύονται με τα ίδια δεδομένα μόνο μία φορά, λόγω των περιορισμών απόδοσης και κόστους, αλλά μπορεί να είναι δυνατό να εκπαιδευτεί ένα μοντέλο πολλές φορές χρησιμοποιώντας τα ίδια δεδομένα, λέει η Swayamdipta.

Ο Percy Liang, καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο του Στάνφορντ, αντίθετα λέει ότι χρειάζεται να βελτιωθεί η ικανότητα των μοντέλων και όχι το μέγεθος για να γίνουν πιο αποτελεσματικά. «Είδαμε πώς τα μικρότερα μοντέλα που εκπαιδεύονται σε δεδομένα υψηλότερης ποιότητας μπορούν να ξεπεράσουν τα μεγαλύτερα μοντέλα που έχουν εκπαιδευτεί σε δεδομένα χαμηλότερης ποιότητας», εξηγεί.

Πηγή: MIT Technology Review

# TAGS

  • CHATBOTS
Δες όλες τις ειδήσεις και τα νέα τη στιγμή που συμβαίνουν
ΑΣΕΠ: Περισσότερες από 16.700 προσλήψεις στο Δημόσιο το 2026 - Νέες θεματικές ενότητες και αλλαγές στα κέντρα

ΑΣΕΠ: Περισσότερες από 16.700 προσλήψεις στο Δημόσιο το 2026 - Νέες θεματικές ενότητες και αλλαγές στα κέντρα

Κλέαρχος Μαρουσάκης: Η ημέρα που έρχεται η πολική αέρια μάζα - Βροχές και στην Αττική

Κλέαρχος Μαρουσάκης: Η ημέρα που έρχεται η πολική αέρια μάζα - Βροχές και στην Αττική

Τέλος στα χάρτινα τιμολόγια: Πώς αλλάζουν οι συναλλαγές μεταξύ επιχειρήσεων

Τέλος στα χάρτινα τιμολόγια: Πώς αλλάζουν οι συναλλαγές μεταξύ επιχειρήσεων

Τι αλλάζει από σήμερα στις συναλλαγές μέσω IRIS

Τι αλλάζει από σήμερα στις συναλλαγές μέσω IRIS

Στο μικροσκόπιο της ΕΕ οι έλεγχοι για το ελληνικό ελαιόλαδο

Στο μικροσκόπιο της ΕΕ οι έλεγχοι για το ελληνικό ελαιόλαδο

Πώς η Βιο-Ακαδημία της DEMO επανασυστήνει τη βιοτεχνολογική εκπαίδευση στην Ελλάδα

Πώς η Βιο-Ακαδημία της DEMO επανασυστήνει τη βιοτεχνολογική εκπαίδευση στην Ελλάδα

Νέα προγράμματα COSMOTE BUSINESS GIGAMAX για επιχειρήσεις και επαγγελματίες

Νέα προγράμματα COSMOTE BUSINESS GIGAMAX για επιχειρήσεις και επαγγελματίες

Το MOMUS Air αλλάζει την εμπειρία του ταξιδιού στο Αεροδρόμιο Θεσσαλονίκης

Το MOMUS Air αλλάζει την εμπειρία του ταξιδιού στο Αεροδρόμιο Θεσσαλονίκης

Kumho Tire: Από τα διεθνή βραβεία στο μέλλον της κινητικότητας

Kumho Tire: Από τα διεθνή βραβεία στο μέλλον της κινητικότητας

ΕΥΔΑΠ: Η μεγάλη «αναγέννηση» των αγωγών της Αθήνας και το επενδυτικό άλμα των 2,5 δισ. ευρώ

ΕΥΔΑΠ: Η μεγάλη «αναγέννηση» των αγωγών της Αθήνας και το επενδυτικό άλμα των 2,5 δισ. ευρώ

Μικροβιακή αντοχή: Πώς θα πρέπει να αντιμετωπίζονται οι μολύνσεις σε παιδιά και ενήλικες

Μικροβιακή αντοχή: Πώς θα πρέπει να αντιμετωπίζονται οι μολύνσεις σε παιδιά και ενήλικες

Ανακαλείται φυτικό συμπλήρωμα διατροφής σε σκόνη από την Superfoods λόγω σαλμονέλας

Ανακαλείται φυτικό συμπλήρωμα διατροφής σε σκόνη από την Superfoods λόγω σαλμονέλας

Γρίπη και ρινικά αποσυμφορητικά: Προσοχή, η κατάχρηση ενέχει κινδύνους

Γρίπη και ρινικά αποσυμφορητικά: Προσοχή, η κατάχρηση ενέχει κινδύνους

Σάκχαρο: Οι απότομες αυξήσεις συνδέονται με αυξημένο κίνδυνο Αλτσχάιμερ

Σάκχαρο: Οι απότομες αυξήσεις συνδέονται με αυξημένο κίνδυνο Αλτσχάιμερ

Η Ελλάδα στο κλαμπ των χωρών της ΕΕ που οι ΑΠΕ κάλυψαν πάνω από το 50% της κατανάλωσης ρεύματος

Η Ελλάδα στο κλαμπ των χωρών της ΕΕ που οι ΑΠΕ κάλυψαν πάνω από το 50% της κατανάλωσης ρεύματος

Πλαίσιο αξιολόγησης με δείκτες παρακολούθησης για τα έξυπνα δίκτυα- Τι προτείνει ο ACER

Πλαίσιο αξιολόγησης με δείκτες παρακολούθησης για τα έξυπνα δίκτυα- Τι προτείνει ο ACER

Γιατί η Ευρώπη θερμαίνεται περισσότερο από τον υπόλοιπο πλανήτη;

Γιατί η Ευρώπη θερμαίνεται περισσότερο από τον υπόλοιπο πλανήτη;

Αξίζει να βάλεις αντλία θερμότητας; Οι ειδικοί απαντούν

Αξίζει να βάλεις αντλία θερμότητας; Οι ειδικοί απαντούν

Πώς θα παραμείνετε ασφαλείς σε περίπτωση «μπλακ άουτ»: Τα απαραίτητα σε ένα κιτ έκτακτης ανάγκης

Πώς θα παραμείνετε ασφαλείς σε περίπτωση «μπλακ άουτ»: Τα απαραίτητα σε ένα κιτ έκτακτης ανάγκης

Φυσικό αέριο: Ρεκόρ κατανάλωσης το 2025 και κυριαρχία του LNG στις εισαγωγές

Φυσικό αέριο: Ρεκόρ κατανάλωσης το 2025 και κυριαρχία του LNG στις εισαγωγές

ΡΟΗ ΕΙΔΗΣΕΩΝ

Τραγωδία στη ΒΙΠΕ Δράμας: Εναερίτης σκοτώθηκε πάνω σε κολόνα της ΔΕΗ

Ελλάδα 15:00

Τσουκαλάς: «Η ΝΔ με την πολιτική της έχει επιτεθεί σε όλες τις κοινωνικές ομάδες και αυτό δημιουργεί έναν ισχυρό άξονα αλληλεγγύης»

Πολιτική 14:55

Μάντζος για συνάντηση Μητσοτάκη - Ερντογάν: Η κυβέρνηση να εγγυηθεί ότι δεν θα αμφισβητηθούν οι ελληνικές θέσεις

Πολιτική 14:55

Μ. Αποστολάκη για νέα σύμβαση με Hellenic Train: «Βάζετε ξανά σε δεύτερη μοίρα το δημόσιο συμφέρον και την ασφάλεια των πολιτών»

Πολιτική 14:53

Πέθανε ο αδερφός του Νίκου Ξυλούρη, Γιάννης (Ψαρογιάννης)

Ελλάδα 14:41

Φρεντέρικσεν: Η φιλοδοξία των ΗΠΑ για κατάληψη της Γροιλανδίας παραμένει στο ακέραιο

Διεθνή 14:35
Όλες Οι Ειδήσεις

ΔΗΜΟΦΙΛΗ

Με το δάχτυλο στη σκανδάλη ο Τραμπ: Οι απειλές του Ιράν και ο συναγερμός στη Μέση Ανατολή

Διεθνή 23:02

Κατερίνα Καινούργιου: Το τηλεφώνημα στο γιατρό και η δυσκολία που αντιμετωπίζει

Life 15:31

Χωρίς μπλόκα και ανοιχτούς δρόμους η απάντηση του Μαξίμου για συνάντηση με τους αγρότες

Πολιτική 18:04

ΑΣΕΠ 8Κ/2024: Ο πρόεδρος του ΑΣΕΠ αποκάλυψε πότε αναμένονται τα αποτελέσματα

Οικονομία 15:11

Η ανάρτηση του Τριαντάφυλλου για Gio Kay και Survivor

Life 20:51
Ειδήσεις από την Περιφέρεια - σε συνεργασία με τα μεγαλύτερα ενημερωτικά μέσα της Περιφέρειας

# HOT TOPICS

  • ΚΑΙΡΟΣ
  • ΛΟΓΑΡΙΑΣΜΟΙ ΡΕΥΜΑΤΟΣ

ΤΙΜΕΣΠΡΟΪΟΝΤΩΝ ΕΝΕΡΓΕΙΑΣ

αναλύσεις & ρεπορτάζ
από την συντακτική ομάδα τουDnews

ΤΙΜΕΣ ΡΕΥΜΑ ΤΙΜΕΣ ΦΥΣ. ΑΕΡΙΟ

Σχετικά Άρθρα

Aγγελος - Eξάγγελος και η κολακεία του chatbot

Aγγελος - Eξάγγελος και η κολακεία του chatbot

Opinions 31.10.2025 06:27
Ποιο chatbot τεχνητής νοημοσύνης διαδίδει τις περισσότερες ψευδείς πληροφορίες; Λάθος 1 στις 3 απαντήσεις

Ποιο chatbot τεχνητής νοημοσύνης διαδίδει τις περισσότερες ψευδείς πληροφορίες; Λάθος 1 στις 3 απαντήσεις

Τεχνολογία 05.09.2025 14:05
Φυλαχτά, chatbot και η οικονομία της εμμονής

Φυλαχτά, chatbot και η οικονομία της εμμονής

Opinions 29.08.2025 07:01
Ο «μυστικός δείπνος» των Chatbot: Δωρέαν «ψυχολόγος», Θεός που ανασταίνει νεκρούς ή ένας ιδανικός εραστής;

Ο «μυστικός δείπνος» των Chatbot: Δωρέαν «ψυχολόγος», Θεός που ανασταίνει νεκρούς ή ένας ιδανικός εραστής;

Τεχνολογία 13.04.2025 07:21

NETWORK

Ευλογιά αιγοπροβάτων: Ξεπέρασαν τις 400 χιλιάδες τα θανατωμένα ζώα

Ευλογιά αιγοπροβάτων: Ξεπέρασαν τις 400 χιλιάδες τα θανατωμένα ζώα

healthstat.gr 01.15.2026 - 12:24
Εφαρμογή νέων Χρεώσεων Χρήσης Συστήματος

Εφαρμογή νέων Χρεώσεων Χρήσης Συστήματος

ienergeia.gr 01.15.2026 - 14:23
ΕΥΔΑΜ: Το 2025 έφερε έργα, επενδύσεις και νέες θέσεις εργασίας στις περιοχές μετάβασης

ΕΥΔΑΜ: Το 2025 έφερε έργα, επενδύσεις και νέες θέσεις εργασίας στις περιοχές μετάβασης

ienergeia.gr 01.15.2026 - 14:19
Ανακαλείται φυτικό συμπλήρωμα διατροφής σε σκόνη από την Superfoods λόγω σαλμονέλας

Ανακαλείται φυτικό συμπλήρωμα διατροφής σε σκόνη από την Superfoods λόγω σαλμονέλας

healthstat.gr 01.15.2026 - 13:10
Η ΕΤΕπ στηρίζει την πρώτη επένδυση παραγωγής γαλλίου στην Ευρώπη με €90 εκατ. για τη METLEN στη Στερεά Ελλάδα

Η ΕΤΕπ στηρίζει την πρώτη επένδυση παραγωγής γαλλίου στην Ευρώπη με €90 εκατ. για τη METLEN στη Στερεά Ελλάδα

ienergeia.gr 01.15.2026 - 14:04
Δύο νέα εργαλεία για τον έλεγχο της συνταγογράφησης

Δύο νέα εργαλεία για τον έλεγχο της συνταγογράφησης

healthstat.gr 01.15.2026 - 13:01
Δημόσια Διαβούλευση της ΡΑΑΕΥ αναφορικά με την Υπηρεσία Φόρτωσης Φορτηγών ΥΦΑ του ΔΕΣΦΑ

Δημόσια Διαβούλευση της ΡΑΑΕΥ αναφορικά με την Υπηρεσία Φόρτωσης Φορτηγών ΥΦΑ του ΔΕΣΦΑ

ienergeia.gr 01.15.2026 - 13:20
Μικροβιακή αντοχή: Πώς θα πρέπει να αντιμετωπίζονται οι μολύνσεις σε παιδιά και ενήλικες

Μικροβιακή αντοχή: Πώς θα πρέπει να αντιμετωπίζονται οι μολύνσεις σε παιδιά και ενήλικες

healthstat.gr 01.15.2026 - 14:09
Dnews

ΟΠΙΝΙΟΝ ΠΟΣΤ ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ Α.Ε. "OPINIONPOST" Διεύθυνση: Ιπποκράτους 2, Αθήνα, 10679, Ελλάδα
ΑΦΜ: 800961697 - ΔΟΥ: ΚΕΦΟΔΕ Αττικής
ΑΡ. ΓΕΜΗ: 145803601000
Τηλ: 210 3608484
E-mail: info@dnews.gr

Domain name: Dnews.gr (Dikaiologitika.gr)
Νόμιμος Εκπρόσωπος - Διευθύνων Σύμβουλος: Νίκος Ανδριόπουλος (andriopoulos@opinion-post.gr)
Ιδιοκτησία: OPINIONPOST A.E. - Μέτοχοι: ENERGY REGISTER Α.Ε. / Ανδριόπουλος Νικόλαος
Δικαιούχος Domain: OPINIONPOST A.E. - Διαχειριστής Domain: Σωτήρης Μπέσκος
Διευθυντής Ιστοσελίδας: Παναγιώτης Ευθυμιάδης
Διευθυντής Σύνταξης: Κώστας Σαρρηκώστας

  • ΤΑΥΤΟΤΗΤΑ
  • ΔΙΑΦΗΜΙΣΗ
  • ΟΡΟΙ ΧΡΗΣΗΣ
  • ΠΟΛΙΤΙΚΗ ΠΡΟΣΤΑΣΙΑΣ ΔΕΔΟΜΕΝΩΝ
  • ΠΟΛΙΤΙΚΗ ΑΠΟΡΡΗΤΟΥ
  • COOKIES
  • ΚΩΔΙΚΑΣ ΔΕΟΝΤΟΛΟΓΙΑΣ
  • ΟΛΕΣ ΟΙ ΕΙΔΗΣΕΙΣ
Μέλος ΕΝΕΔ

Copyright © 2011 - 2026 OpinionPost S.A. All rights reserved.

Developed by Nuevvo.

ΜΕΛΟΣ #242054 Μ.Η.Τ. Μέλος #242054 του Μ.Η.Τ.
  • Πολιτική
  • Οικονομία
  • Ελλάδα
  • Διεθνή
  • Life
  • Παιδεία
  • Υγεία
  • Αθλητισμός
  • Επιστήμη
  • Επιχειρήσεις
  • Θέσεις Εργασίας
  • Ο Πληροφοριοδότης
  • Παιχνίδια Εξουσίας
  • Τεχνολογία
  • Auto - Moto
  • Entertainment
  • Market Maven
  • News In English
  • Opinions
  • Ειδήσεις Από Την Περιφέρεια
  • Όλες οι Ειδήσεις
Games