Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Games
ΡΟΗ ΕΙΔΗΣΕΩΝ
Επιστήμη 02.02.2023 18:25

Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται

Image of Βασιλική Μιχοπούλου Βασιλική Μιχοπούλου
Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται Φωτογραφία: ΑΠΕ-ΜΠΕ
Το απόθεμα των γλωσσικών δεδομένων στα οποία εκπαιδεύεται η τεχνητή νοημοσύνη, όπως το ChatGPT, θα μπορούσε να εξαντληθεί έως το 2026, επειδή η ΑΙ τα καταναλώνει γρηγορότερα από ό,τι τα παράγουν οι άνθρωποι.

Η παροχή γλωσσικών δεδομένων υψηλής ποιότητας που χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης με μηχανική μάθηση μπορεί να εξαντληθεί σε τρία χρόνια, οδηγώντας την πρόοδο της τεχνητής νοημοσύνης σε στασιμότητα, διαπιστώνουν αμερικανοί ερευνητές.

Η μηχανική εκμάθηση εξουσιοδοτεί προγράμματα τεχνητής νοημοσύνης, όπως το Midjourney και το ChatGPT του OpenAI που βασίζεται σε συνομιλία. Τέτοια μοντέλα εκπαιδεύονται σε τεράστιες ομάδες δεδομένων που έχουν δημιουργηθεί από τον άνθρωπο στο Διαδίκτυο. Ωστόσο, σύμφωνα με μια ομάδα εμπειρογνωμόνων στη τεχνητή νοημοσύνη διαφαίνεται ένα πρόβλημα στον ορίζοντα: μπορεί να ξεμείνουμε από δεδομένα για να τα εκπαιδεύσουμε.

Τα γλωσσικά μοντέλα εκπαιδεύονται χρησιμοποιώντας κείμενα από πηγές όπως η Wikipedia, άρθρα ειδήσεων, επιστημονικές εργασίες και βιβλία. Η τάση τα τελευταία χρόνια ήταν αυτά τα μοντέλα να εκπαιδεύονται σε όλο και περισσότερα δεδομένα με την ελπίδα να καταστούν πιο ακριβή και ευέλικτα. Οι ερευνητές που δημιουργούν πιο ισχυρά μοντέλα με μεγαλύτερες δυνατότητες, πρέπει να βρουν όλο και περισσότερα κείμενα για να τα εκπαιδεύσουν και ανησυχούν ολοένα και περισσότερο ότι θα ξεμείνουν από αυτού του είδους τα δεδομένα.

Σύμφωνα με μια επιστημονική δημοσίευση ερευνητών από τον Epoch , έναν οργανισμό έρευνας και πρόβλεψης τεχνητής νοημοσύνης, το απόθεμα γλωσσικών δεδομένων αυξάνεται επί του παρόντος κατά 7% ετησίως, αλλά το μοντέλο τους προβλέπει επιβράδυνση στο 1% μέχρι το 2100. Το απόθεμα είναι αυτή τη στιγμή μεταξύ 7e13 και 7e16 λέξεων, το οποίο είναι κατά 1,5 έως 4,5 τάξεις μεγέθους μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων που χρησιμοποιούνται σήμερα. Με βάση αυτές τις τάσεις, πιθανότατα θα ξεμείνουμε από δεδομένα στο χρονικό διάστημα μεταξύ 2030 και 2050.

Σύμφωνα πάντα με τη δημοσίευση του Epoch, οι ερευνητές γλώσσας ΑΙ τεχνητής φιλτράρουν τα δεδομένα που χρησιμοποιούν για την εκπαίδευση μοντέλων σε δύο κατηγορίες, σε υψηλής και σε χαμηλής ποιότητας. Η γραμμή μεταξύ των δύο κατηγοριών μπορεί να είναι ασαφής, λέει ο Pablo Villalobos, ερευνητής του Epoch και ο κύριος συγγραφέας της μελέτης, ωστόσο το κείμενο από την πρώτη κατηγορία θεωρείται καλύτερα γραμμένο και συχνά παράγεται από επαγγελματίες συγγραφείς. Συγκριτικά με το μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων, το απόθεμα γλωσσικών δεδομένων υψηλής ποιότητας είναι μεταξύ 4,6e12 και 1,7e13 λέξεων, δηλαδή μικρότερο κατά μία τάξη μεγέθους. Είμαστε σε μια τάξη μεγέθους υψηλής ποιότητας δεδομένων με εξαντλητική τάση που πιθανότατα θα συμβεί μεταξύ 2023 και 2027.

ΟΙ ΕΙΔΗΣΕΙΣ ΣΕ 2'

Όσα πρέπει να ξέρετε
για να ξεκινήσετε τη μέρα σας.

* Με την εγγραφή σας στο newsletter του Dnews, αποδέχεστε τους σχετικούς όρους χρήσης

Τα δεδομένα από κατηγορίες χαμηλής ποιότητας αποτελούνται από κείμενα όπως αναρτήσεις μέσων κοινωνικής δικτύωσης ή σχόλια σε ιστότοπους όπως το 4chan, τα οποία υπερτερούν σε αριθμό εκείνων που θεωρούνται υψηλής ποιότητας. Οι ερευνητές συνήθως εκπαιδεύουν μοντέλα χρησιμοποιώντας μόνο δεδομένα που εμπίπτουν στην κατηγορία υψηλής ποιότητας, επειδή αυτός είναι ο τύπος γλώσσας που θέλουν να αναπαράγουν τα μοντέλα. Αυτή η προσέγγιση οδήγησε σε μερικά εντυπωσιακά αποτελέσματα για μεγάλα γλωσσικά μοντέλα όπως το GPT-3.

Αντίστοιχα, η μελλοντική ανάπτυξη των συνόλων δεδομένων εικόνων δείχνει να είναι μικρότερη, ωστόσο, ο ρυθμός ανάπτυξης φαίνεται να είναι περίπου 18% έως 31% ετησίως. Το απόθεμα δεδομένων όρασης αυξάνεται επί του παρόντος κατά 8% ετησίως, αλλά αναμένεται να επιβραδυνθεί στο 1% έως το 2100. Η προβολή αυτών των τάσεων υπογραμμίζει ότι οι εκπαιδευτές μοντέλων ΑΙ πιθανότατα θα τρέξουν δεδομένα εκτός όρασης μεταξύ 2030 και 2070

Ένας τρόπος για να ξεπεραστούν αυτοί οι περιορισμοί δεδομένων θα ήταν να επαναξιολογηθεί αυτό που ορίζεται ως «χαμηλή» και «υψηλή» ποιότητα, σύμφωνα με την Swabha Swayamdipta, καθηγήτρια μηχανικής μάθησης στο Πανεπιστήμιο της Νότιας Καλιφόρνια που ειδικεύεται στην ποιότητα των συνόλων δεδομένων. Εάν οι ελλείψεις δεδομένων ωθήσουν τους ερευνητές της τεχνητής νοημοσύνης να ενσωματώσουν πιο διαφορετικά σύνολα δεδομένων στη διαδικασία εκπαίδευσης, θα ήταν «καθαρά θετικό» για τα γλωσσικά μοντέλα, λέει η ίδια.

Οι ερευνητές μπορούν επίσης να βρουν τρόπους να παρατείνουν τη διάρκεια ζωής των δεδομένων που χρησιμοποιούνται για την εκπαίδευση γλωσσικών μοντέλων. Επί του παρόντος, αυτά τα μοντέλα εκπαιδεύονται με τα ίδια δεδομένα μόνο μία φορά, λόγω των περιορισμών απόδοσης και κόστους, αλλά μπορεί να είναι δυνατό να εκπαιδευτεί ένα μοντέλο πολλές φορές χρησιμοποιώντας τα ίδια δεδομένα, λέει η Swayamdipta.

Ο Percy Liang, καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο του Στάνφορντ, αντίθετα λέει ότι χρειάζεται να βελτιωθεί η ικανότητα των μοντέλων και όχι το μέγεθος για να γίνουν πιο αποτελεσματικά. «Είδαμε πώς τα μικρότερα μοντέλα που εκπαιδεύονται σε δεδομένα υψηλότερης ποιότητας μπορούν να ξεπεράσουν τα μεγαλύτερα μοντέλα που έχουν εκπαιδευτεί σε δεδομένα χαμηλότερης ποιότητας», εξηγεί.

Πηγή: MIT Technology Review

# TAGS

  • CHATBOTS
Δες όλες τις ειδήσεις και τα νέα τη στιγμή που συμβαίνουν
Τέλος οι δωρεάν τραπεζικοί λογαριασμοί - Αύξηση έως 341 εκατ. ευρώ στα έσοδα των τραπεζών

Τέλος οι δωρεάν τραπεζικοί λογαριασμοί - Αύξηση έως 341 εκατ. ευρώ στα έσοδα των τραπεζών

ΕΝΦΙΑ 2026: Εκπτώσεις, αυξήσεις και παγίδες στα εφετινά εκκαθαριστικά

ΕΝΦΙΑ 2026: Εκπτώσεις, αυξήσεις και παγίδες στα εφετινά εκκαθαριστικά

Τελευταία ημέρα για αίτηση χωριστής φορολογικής δήλωσης από τα ζευγάρια

Τελευταία ημέρα για αίτηση χωριστής φορολογικής δήλωσης από τα ζευγάρια

ΕΦΚΑ: Νέα ρύθμιση οφειλών με ατομικό προφίλ

ΕΦΚΑ: Νέα ρύθμιση οφειλών με ατομικό προφίλ

Κλέαρχος Μαρουσάκης: Έρχεται θερμή αέρια μάζα τα επόμενα 24ωρα

Κλέαρχος Μαρουσάκης: Έρχεται θερμή αέρια μάζα τα επόμενα 24ωρα

Νέο επιμορφωτικό πρόγραμμα «Ψηφιακή Αυτονομία 60+» της Πειραιώς στο πλαίσιο του EQUALL, για τον ψηφιακό εγγραμματισμό ατόμων 60+

Νέο επιμορφωτικό πρόγραμμα «Ψηφιακή Αυτονομία 60+» της Πειραιώς στο πλαίσιο του EQUALL, για τον ψηφιακό εγγραμματισμό ατόμων 60+

Campeón Gaming: 6 χρόνια πιστοποίησης από την Great Place to Work® Hellas - Γιατί οι άνθρωποί της είναι αυτοί που φέρνουν τις πιο μεγάλες νίκες!

Campeón Gaming: 6 χρόνια πιστοποίησης από την Great Place to Work® Hellas - Γιατί οι άνθρωποί της είναι αυτοί που φέρνουν τις πιο μεγάλες νίκες!

FAQ: Τι ισχύει πραγματικά με το επίδομα έως 750€

FAQ: Τι ισχύει πραγματικά με το επίδομα έως 750€

Ποια απρόβλεπτα αξίζει πραγματικά να ζήσεις;

Ποια απρόβλεπτα αξίζει πραγματικά να ζήσεις;

Αν χρειάζεστε βοήθεια για να ανεβείτε τις σκάλες, τότε το αναβατόριο σκάλας της Draculis, είναι η λύση!

Αν χρειάζεστε βοήθεια για να ανεβείτε τις σκάλες, τότε το αναβατόριο σκάλας της Draculis, είναι η λύση!

Νοσοκομεία περιφέρειας σε οριακή λειτουργία

Νοσοκομεία περιφέρειας σε οριακή λειτουργία

4 συχνές διατροφικές ελλείψεις - Τι πρέπει να κάνετε

4 συχνές διατροφικές ελλείψεις - Τι πρέπει να κάνετε

Γιατί πρέπει να πλένετε ξεχωριστά τις πετσέτες μπάνιου και κουζίνας;

Γιατί πρέπει να πλένετε ξεχωριστά τις πετσέτες μπάνιου και κουζίνας;

Πρωινές ασκήσεις για δυνατό κορμό και πιο σφιχτή κοιλιά μετά τα 55

Πρωινές ασκήσεις για δυνατό κορμό και πιο σφιχτή κοιλιά μετά τα 55

Ηλεκτρισμός: Ισχυρή άνοδος παραγωγής με «πράσινη» ραχοκοκαλιά τον Ιανουάριο- Τα μερίδια των προμηθευτών

Ηλεκτρισμός: Ισχυρή άνοδος παραγωγής με «πράσινη» ραχοκοκαλιά τον Ιανουάριο- Τα μερίδια των προμηθευτών

Στενά του Ορμούζ: Πίεση στο πετρέλαιο και αυξήσεις στα καύσιμα- Ενισχύονται οι έλεγχοι στην αγορά

Στενά του Ορμούζ: Πίεση στο πετρέλαιο και αυξήσεις στα καύσιμα- Ενισχύονται οι έλεγχοι στην αγορά

Το σενάριο για εκτίναξη του πετρελαίου στα 100 δολάρια και οι επιπτώσεις στην ελληνική οικονομία

Το σενάριο για εκτίναξη του πετρελαίου στα 100 δολάρια και οι επιπτώσεις στην ελληνική οικονομία

House burping: Το διάλειμμα από το καλοριφέρ που έγινε viral στο TikTok

House burping: Το διάλειμμα από το καλοριφέρ που έγινε viral στο TikTok

Ποιες συσκευές ανεβάζουν «σιωπηλά» τον λογαριασμό ρεύματος: Η έκπληξη στην πρωτιά

Ποιες συσκευές ανεβάζουν «σιωπηλά» τον λογαριασμό ρεύματος: Η έκπληξη στην πρωτιά

Άλμα έως 8% κατέγραψαν οι τιμές του πετρελαίου εν μέσω ανησυχιών για τις εξελίξεις στη Μέση Ανατολή

Άλμα έως 8% κατέγραψαν οι τιμές του πετρελαίου εν μέσω ανησυχιών για τις εξελίξεις στη Μέση Ανατολή

ΡΟΗ ΕΙΔΗΣΕΩΝ

Κλέαρχος Μαρουσάκης: Έρχεται θερμή αέρια μάζα τα επόμενα 24ωρα

Ελλάδα 08:16

Διευρύνεται η σύγκρουση στη Μέση Ανατολή: Ο πόλεμος έφτασε στον Λίβανο, εκρήξεις και εγκλωβισμένοι στον Κόλπο

Διεθνή 08:15

Τι γνωρίζουμε για το ιρανικό χτύπημα στην Κύπρο, το διάγγελμα Χριστοδουλίδη

Διεθνή 08:13

Κολωνός: Μυστήριο με τον θάνατο 31χρονης εγκύου - Aναζητούσε δομή για κακοποιημένες γυναίκες

Ελλάδα 07:40

Τραγωδία στον Πειραιά: 17χρονη έπεσε από τον 5ο όροφο πολυκατοικίας

Ελλάδα 07:31

Ιράν, 48 ώρες μετά: Υπεροχή των ΗΠΑ στο πεδίο, στρατηγική ασάφεια - Τα 10 κύρια ζητήματα αυτήν τη στιγμή

Διεθνή 07:28
Όλες Οι Ειδήσεις

ΔΗΜΟΦΙΛΗ

Τρόμος στη Μέση Ανατολή με νέο τελεσίγραφο Τραμπ στο Ιράν: Πολεμικές επιχειρήσεις μέχρι τέλους

Διεθνή 23:08

Ντουμπάι: Έκκληση για βοήθεια από εγκλωβισμένους Έλληνες: «Δεν υπάρχει σχέδιο διαφυγής - Έχουμε άρρωστα παιδιά»

Ελλάδα 11:26

Pilates: Πόσος χρόνος χρειάζεται για να φανούν τα αποτελέσματα - Τι απαντούν κορυφαίοι γυμναστές

Life 13:38

Γυναίκα 100 ετών, που λατρεύει την αεροβική στο νερό και ζει μόνη, μοιράζεται απλές συμβουλές μακροζωίας

Life 17:03

Πούτιν για θάνατο Χαμενεΐ: «Κυνική δολοφονία - Παραβιάζει κάθε ανθρώπινη ηθική»

Διεθνή 13:07
Ειδήσεις από την Περιφέρεια - σε συνεργασία με τα μεγαλύτερα ενημερωτικά μέσα της Περιφέρειας

# HOT TOPICS

  • ΚΑΙΡΟΣ
  • ΛΟΓΑΡΙΑΣΜΟΙ ΡΕΥΜΑΤΟΣ

ΤΙΜΕΣΠΡΟΪΟΝΤΩΝ ΕΝΕΡΓΕΙΑΣ

αναλύσεις & ρεπορτάζ
από την συντακτική ομάδα τουDnews

ΤΙΜΕΣ ΡΕΥΜΑ ΤΙΜΕΣ ΦΥΣ. ΑΕΡΙΟ

Σχετικά Άρθρα

Η Burger King θα ελέγχει με AI chatbot αν οι υπάλληλοι λένε «παρακαλώ» και «ευχαριστώ»

Η Burger King θα ελέγχει με AI chatbot αν οι υπάλληλοι λένε «παρακαλώ» και «ευχαριστώ»

Διεθνή 27.02.2026 09:53
Τα chatbots τεχνητής νοημοσύνης δεν είναι φίλοι σας, προειδοποιούν ειδικοί

Τα chatbots τεχνητής νοημοσύνης δεν είναι φίλοι σας, προειδοποιούν ειδικοί

Τεχνολογία 03.02.2026 09:41
Aγγελος - Eξάγγελος και η κολακεία του chatbot

Aγγελος - Eξάγγελος και η κολακεία του chatbot

Opinions 31.10.2025 06:27
Ποιο chatbot τεχνητής νοημοσύνης διαδίδει τις περισσότερες ψευδείς πληροφορίες; Λάθος 1 στις 3 απαντήσεις

Ποιο chatbot τεχνητής νοημοσύνης διαδίδει τις περισσότερες ψευδείς πληροφορίες; Λάθος 1 στις 3 απαντήσεις

Τεχνολογία 05.09.2025 14:05

NETWORK

Νοσοκομεία περιφέρειας σε οριακή λειτουργία

Νοσοκομεία περιφέρειας σε οριακή λειτουργία

healthstat.gr 03.02.2026 - 06:12
Γιατί πρέπει να πλένετε ξεχωριστά τις πετσέτες μπάνιου και κουζίνας;

Γιατί πρέπει να πλένετε ξεχωριστά τις πετσέτες μπάνιου και κουζίνας;

healthstat.gr 03.02.2026 - 06:46
ΔΕΗ: Έως 23% οι μειώσεις στα τιμολόγια της τον Μάρτιο

ΔΕΗ: Έως 23% οι μειώσεις στα τιμολόγια της τον Μάρτιο

ienergeia.gr 03.02.2026 - 08:24
Στ. Παπασταύρου: Θωρακίζουμε έμπρακτα τον θαλάσσιο φυσικό μας πλούτο

Στ. Παπασταύρου: Θωρακίζουμε έμπρακτα τον θαλάσσιο φυσικό μας πλούτο

ienergeia.gr 03.02.2026 - 08:38
Μεγάλη ανησυχία για αντίποινα- Η έκτακτη επίσκεψη αρχηγών ΓΕΑ και ΓΕΣ στη βάση της Σούδας

Μεγάλη ανησυχία για αντίποινα- Η έκτακτη επίσκεψη αρχηγών ΓΕΑ και ΓΕΣ στη βάση της Σούδας

ienergeia.gr 03.02.2026 - 08:09
Πρωινές ασκήσεις για δυνατό κορμό και πιο σφιχτή κοιλιά μετά τα 55

Πρωινές ασκήσεις για δυνατό κορμό και πιο σφιχτή κοιλιά μετά τα 55

healthstat.gr 03.02.2026 - 06:28
Άλμα έως 8% κατέγραψαν οι τιμές του πετρελαίου εν μέσω ανησυχιών για τις εξελίξεις στη Μέση Ανατολή

Άλμα έως 8% κατέγραψαν οι τιμές του πετρελαίου εν μέσω ανησυχιών για τις εξελίξεις στη Μέση Ανατολή

ienergeia.gr 03.02.2026 - 08:13
Η δύναμη της συνήθειας: Η ρουτίνα βελτιώνει την ψυχική υγεία

Η δύναμη της συνήθειας: Η ρουτίνα βελτιώνει την ψυχική υγεία

healthstat.gr 03.02.2026 - 08:34
Dnews

ΟΠΙΝΙΟΝ ΠΟΣΤ ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ Α.Ε. "OPINIONPOST" Διεύθυνση: Ιπποκράτους 2, Αθήνα, 10679, Ελλάδα
ΑΦΜ: 800961697 - ΔΟΥ: ΚΕΦΟΔΕ Αττικής
ΑΡ. ΓΕΜΗ: 145803601000
Τηλ: 210 3608484
E-mail: info@dnews.gr

Domain name: Dnews.gr (Dikaiologitika.gr)
Νόμιμος Εκπρόσωπος - Διευθύνων Σύμβουλος: Νίκος Ανδριόπουλος (andriopoulos@opinion-post.gr)
Ιδιοκτησία: OPINIONPOST A.E. - Μέτοχοι: ENERGY REGISTER Α.Ε. / Ανδριόπουλος Νικόλαος
Δικαιούχος Domain: OPINIONPOST A.E. - Διαχειριστής Domain: Σωτήρης Μπέσκος
Διευθυντής Ιστοσελίδας: Παναγιώτης Ευθυμιάδης
Διευθυντής Σύνταξης: Κώστας Σαρρηκώστας

  • ΤΑΥΤΟΤΗΤΑ
  • ΔΙΑΦΗΜΙΣΗ
  • ΟΡΟΙ ΧΡΗΣΗΣ
  • ΠΟΛΙΤΙΚΗ ΠΡΟΣΤΑΣΙΑΣ ΔΕΔΟΜΕΝΩΝ
  • ΠΟΛΙΤΙΚΗ ΑΠΟΡΡΗΤΟΥ
  • COOKIES
  • ΚΩΔΙΚΑΣ ΔΕΟΝΤΟΛΟΓΙΑΣ
  • ΟΛΕΣ ΟΙ ΕΙΔΗΣΕΙΣ
Μέλος ΕΝΕΔ

Copyright © 2011 - 2026 OpinionPost S.A. All rights reserved.

Developed by Nuevvo.

ΜΕΛΟΣ #242054 Μ.Η.Τ. Μέλος #242054 του Μ.Η.Τ.
  • Πολιτική
  • Οικονομία
  • Ελλάδα
  • Διεθνή
  • Life
  • Παιδεία
  • Υγεία
  • Αθλητισμός
  • Επιστήμη
  • Επιχειρήσεις
  • Θέσεις Εργασίας
  • Ο Πληροφοριοδότης
  • Παιχνίδια Εξουσίας
  • Τεχνολογία
  • Auto - Moto
  • Entertainment
  • Market Maven
  • News In English
  • Opinions
  • Ειδήσεις Από Την Περιφέρεια
  • Όλες οι Ειδήσεις
Games