Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Dnews
  • ΠΟΛΙΤΙΚΗ
  • ΟΙΚΟΝΟΜΙΑ
  • ΕΛΛΑΔΑ
  • ΔΙΕΘΝΗ
  • ΠΑΙΔΕΙΑ
  • ΘΕΣΕΙΣ ΕΡΓΑΣΙΑΣ
  • ENTERTAINMENT
  • NEWS IN ENGLISH
Games
ΡΟΗ ΕΙΔΗΣΕΩΝ
Επιστήμη 02.02.2023 18:25

Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται

Image of Βασιλική Μιχοπούλου Βασιλική Μιχοπούλου
Τα chatbot AI θα πιάσουν «ταβάνι» μετά το 2026 καθώς τα δεδομένα εκπαίδευσης εξαντλούνται Φωτογραφία: ΑΠΕ-ΜΠΕ
Google Preferred Source Badge

Πρόσθεσε το Dnews στα αγαπημένα σου στη Google

Το απόθεμα των γλωσσικών δεδομένων στα οποία εκπαιδεύεται η τεχνητή νοημοσύνη, όπως το ChatGPT, θα μπορούσε να εξαντληθεί έως το 2026, επειδή η ΑΙ τα καταναλώνει γρηγορότερα από ό,τι τα παράγουν οι άνθρωποι.

Η παροχή γλωσσικών δεδομένων υψηλής ποιότητας που χρησιμοποιούνται για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης με μηχανική μάθηση μπορεί να εξαντληθεί σε τρία χρόνια, οδηγώντας την πρόοδο της τεχνητής νοημοσύνης σε στασιμότητα, διαπιστώνουν αμερικανοί ερευνητές.

Η μηχανική εκμάθηση εξουσιοδοτεί προγράμματα τεχνητής νοημοσύνης, όπως το Midjourney και το ChatGPT του OpenAI που βασίζεται σε συνομιλία. Τέτοια μοντέλα εκπαιδεύονται σε τεράστιες ομάδες δεδομένων που έχουν δημιουργηθεί από τον άνθρωπο στο Διαδίκτυο. Ωστόσο, σύμφωνα με μια ομάδα εμπειρογνωμόνων στη τεχνητή νοημοσύνη διαφαίνεται ένα πρόβλημα στον ορίζοντα: μπορεί να ξεμείνουμε από δεδομένα για να τα εκπαιδεύσουμε.

Τα γλωσσικά μοντέλα εκπαιδεύονται χρησιμοποιώντας κείμενα από πηγές όπως η Wikipedia, άρθρα ειδήσεων, επιστημονικές εργασίες και βιβλία. Η τάση τα τελευταία χρόνια ήταν αυτά τα μοντέλα να εκπαιδεύονται σε όλο και περισσότερα δεδομένα με την ελπίδα να καταστούν πιο ακριβή και ευέλικτα. Οι ερευνητές που δημιουργούν πιο ισχυρά μοντέλα με μεγαλύτερες δυνατότητες, πρέπει να βρουν όλο και περισσότερα κείμενα για να τα εκπαιδεύσουν και ανησυχούν ολοένα και περισσότερο ότι θα ξεμείνουν από αυτού του είδους τα δεδομένα.

Σύμφωνα με μια επιστημονική δημοσίευση ερευνητών από τον Epoch , έναν οργανισμό έρευνας και πρόβλεψης τεχνητής νοημοσύνης, το απόθεμα γλωσσικών δεδομένων αυξάνεται επί του παρόντος κατά 7% ετησίως, αλλά το μοντέλο τους προβλέπει επιβράδυνση στο 1% μέχρι το 2100. Το απόθεμα είναι αυτή τη στιγμή μεταξύ 7e13 και 7e16 λέξεων, το οποίο είναι κατά 1,5 έως 4,5 τάξεις μεγέθους μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων που χρησιμοποιούνται σήμερα. Με βάση αυτές τις τάσεις, πιθανότατα θα ξεμείνουμε από δεδομένα στο χρονικό διάστημα μεταξύ 2030 και 2050.

Σύμφωνα πάντα με τη δημοσίευση του Epoch, οι ερευνητές γλώσσας ΑΙ τεχνητής φιλτράρουν τα δεδομένα που χρησιμοποιούν για την εκπαίδευση μοντέλων σε δύο κατηγορίες, σε υψηλής και σε χαμηλής ποιότητας. Η γραμμή μεταξύ των δύο κατηγοριών μπορεί να είναι ασαφής, λέει ο Pablo Villalobos, ερευνητής του Epoch και ο κύριος συγγραφέας της μελέτης, ωστόσο το κείμενο από την πρώτη κατηγορία θεωρείται καλύτερα γραμμένο και συχνά παράγεται από επαγγελματίες συγγραφείς. Συγκριτικά με το μεγαλύτερο από τα μεγαλύτερα σύνολα δεδομένων, το απόθεμα γλωσσικών δεδομένων υψηλής ποιότητας είναι μεταξύ 4,6e12 και 1,7e13 λέξεων, δηλαδή μικρότερο κατά μία τάξη μεγέθους. Είμαστε σε μια τάξη μεγέθους υψηλής ποιότητας δεδομένων με εξαντλητική τάση που πιθανότατα θα συμβεί μεταξύ 2023 και 2027.

ΟΙ ΕΙΔΗΣΕΙΣ ΣΕ 2'

Όσα πρέπει να ξέρετε
για να ξεκινήσετε τη μέρα σας.

* Με την εγγραφή σας στο newsletter του Dnews, αποδέχεστε τους σχετικούς όρους χρήσης

Τα δεδομένα από κατηγορίες χαμηλής ποιότητας αποτελούνται από κείμενα όπως αναρτήσεις μέσων κοινωνικής δικτύωσης ή σχόλια σε ιστότοπους όπως το 4chan, τα οποία υπερτερούν σε αριθμό εκείνων που θεωρούνται υψηλής ποιότητας. Οι ερευνητές συνήθως εκπαιδεύουν μοντέλα χρησιμοποιώντας μόνο δεδομένα που εμπίπτουν στην κατηγορία υψηλής ποιότητας, επειδή αυτός είναι ο τύπος γλώσσας που θέλουν να αναπαράγουν τα μοντέλα. Αυτή η προσέγγιση οδήγησε σε μερικά εντυπωσιακά αποτελέσματα για μεγάλα γλωσσικά μοντέλα όπως το GPT-3.

Αντίστοιχα, η μελλοντική ανάπτυξη των συνόλων δεδομένων εικόνων δείχνει να είναι μικρότερη, ωστόσο, ο ρυθμός ανάπτυξης φαίνεται να είναι περίπου 18% έως 31% ετησίως. Το απόθεμα δεδομένων όρασης αυξάνεται επί του παρόντος κατά 8% ετησίως, αλλά αναμένεται να επιβραδυνθεί στο 1% έως το 2100. Η προβολή αυτών των τάσεων υπογραμμίζει ότι οι εκπαιδευτές μοντέλων ΑΙ πιθανότατα θα τρέξουν δεδομένα εκτός όρασης μεταξύ 2030 και 2070

Ένας τρόπος για να ξεπεραστούν αυτοί οι περιορισμοί δεδομένων θα ήταν να επαναξιολογηθεί αυτό που ορίζεται ως «χαμηλή» και «υψηλή» ποιότητα, σύμφωνα με την Swabha Swayamdipta, καθηγήτρια μηχανικής μάθησης στο Πανεπιστήμιο της Νότιας Καλιφόρνια που ειδικεύεται στην ποιότητα των συνόλων δεδομένων. Εάν οι ελλείψεις δεδομένων ωθήσουν τους ερευνητές της τεχνητής νοημοσύνης να ενσωματώσουν πιο διαφορετικά σύνολα δεδομένων στη διαδικασία εκπαίδευσης, θα ήταν «καθαρά θετικό» για τα γλωσσικά μοντέλα, λέει η ίδια.

Οι ερευνητές μπορούν επίσης να βρουν τρόπους να παρατείνουν τη διάρκεια ζωής των δεδομένων που χρησιμοποιούνται για την εκπαίδευση γλωσσικών μοντέλων. Επί του παρόντος, αυτά τα μοντέλα εκπαιδεύονται με τα ίδια δεδομένα μόνο μία φορά, λόγω των περιορισμών απόδοσης και κόστους, αλλά μπορεί να είναι δυνατό να εκπαιδευτεί ένα μοντέλο πολλές φορές χρησιμοποιώντας τα ίδια δεδομένα, λέει η Swayamdipta.

Ο Percy Liang, καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο του Στάνφορντ, αντίθετα λέει ότι χρειάζεται να βελτιωθεί η ικανότητα των μοντέλων και όχι το μέγεθος για να γίνουν πιο αποτελεσματικά. «Είδαμε πώς τα μικρότερα μοντέλα που εκπαιδεύονται σε δεδομένα υψηλότερης ποιότητας μπορούν να ξεπεράσουν τα μεγαλύτερα μοντέλα που έχουν εκπαιδευτεί σε δεδομένα χαμηλότερης ποιότητας», εξηγεί.

Πηγή: MIT Technology Review

Google Preferred Source Badge

Πρόσθεσε το Dnews στα αγαπημένα σου στη Google

# TAGS

  • CHATBOTS
Δες όλες τις ειδήσεις και τα νέα τη στιγμή που συμβαίνουν
Public: Νέα εμπειρία θέασης με XL Τηλεοράσεις

Public: Νέα εμπειρία θέασης με XL Τηλεοράσεις

Πόσα βγάζει σήμερα ένας διανομέας; Τα δεδομένα πίσω από την καθημερινότητα του επαγγέλματος

Πόσα βγάζει σήμερα ένας διανομέας; Τα δεδομένα πίσω από την καθημερινότητα του επαγγέλματος

ProntoPegno: Η έξυπνη κίνηση πριν από τις διακοπές σας

ProntoPegno: Η έξυπνη κίνηση πριν από τις διακοπές σας

Το Forward εξελίσσεται σε ένα δυναμικό οικοσύστημα 100 μικρομεσαίων επιχειρήσεων

Το Forward εξελίσσεται σε ένα δυναμικό οικοσύστημα 100 μικρομεσαίων επιχειρήσεων

Η μεγάλη γιορτή του ποδηλάτου και της βιώσιμης μετακίνησης με την ενέργεια της ΔΕΗ

Η μεγάλη γιορτή του ποδηλάτου και της βιώσιμης μετακίνησης με την ενέργεια της ΔΕΗ

ΣΥΡΙΖΑ: Παραιτήσεις πριν (;) το Σάββατο- Ανεξαρτητοποιήσεις μετά την Κεντρική Επιτροπή

ΣΥΡΙΖΑ: Παραιτήσεις πριν (;) το Σάββατο- Ανεξαρτητοποιήσεις μετά την Κεντρική Επιτροπή

Τουρισμός: Χιλιάδες κενές θέσεις εργασίας και νέα απεργιακή κινητοποίηση στον κλάδο

Τουρισμός: Χιλιάδες κενές θέσεις εργασίας και νέα απεργιακή κινητοποίηση στον κλάδο

ΑΑΔΕ: Οδηγός για τις τροποποιητικές δηλώσεις για αναδρομικά 2024

ΑΑΔΕ: Οδηγός για τις τροποποιητικές δηλώσεις για αναδρομικά 2024

Τουρισμός για όλους 2026: Τι ισχύει με το πρόγραμμα, «αγνοούνται» τα voucher διακοπών

Τουρισμός για όλους 2026: Τι ισχύει με το πρόγραμμα, «αγνοούνται» τα voucher διακοπών

Παρί Σεν Ζερμέν - Άρσεναλ: Βίαια επεισόδια στη Γαλλία μετά τον τελικό - 416 συλλήψεις

Παρί Σεν Ζερμέν - Άρσεναλ: Βίαια επεισόδια στη Γαλλία μετά τον τελικό - 416 συλλήψεις

Έμπολα: 16 κρίσιμες ερωτήσεις και απαντήσεις για τον θανατηφόρο ιό

Έμπολα: 16 κρίσιμες ερωτήσεις και απαντήσεις για τον θανατηφόρο ιό

Ένας αρχαίος παθογόνος γίνεται ολοένα και πιο ανθεκτικός στα αντιβιοτικά

Ένας αρχαίος παθογόνος γίνεται ολοένα και πιο ανθεκτικός στα αντιβιοτικά

Πώς να κοιμηθείτε άνετα και να βελτιώσετε τον ύπνο σας το καλοκαίρι

Πώς να κοιμηθείτε άνετα και να βελτιώσετε τον ύπνο σας το καλοκαίρι

Εύκολες γαλλικές κρέπες: Η κλασική συνταγή που πρέπει να δοκιμάσετε

Εύκολες γαλλικές κρέπες: Η κλασική συνταγή που πρέπει να δοκιμάσετε

Πώς η ενέργεια τροφοδοτεί τις ανατιμήσεις στα τρόφιμα - Τι δείχνει η μελέτη του ΙΟΒΕ

Πώς η ενέργεια τροφοδοτεί τις ανατιμήσεις στα τρόφιμα - Τι δείχνει η μελέτη του ΙΟΒΕ

Motor Oil: Ισχυρή ζήτηση και κερδοφορία παρά τις ανατροπές στην αγορά πετρελαίου

Motor Oil: Ισχυρή ζήτηση και κερδοφορία παρά τις ανατροπές στην αγορά πετρελαίου

Μπορεί μια smart TV να λειτουργήσει χωρίς WiFi;

Μπορεί μια smart TV να λειτουργήσει χωρίς WiFi;

Το πρωτότυπο σύστημα ψύξης που λειτουργεί χωρίς ηλεκτρισμό

Το πρωτότυπο σύστημα ψύξης που λειτουργεί χωρίς ηλεκτρισμό

Σταθερή ετήσια αύξηση για το επιτρεπόμενο έσοδο του ΔΕΔΔΗΕ- Στα 1,12 δις ευρώ για το 2026

Σταθερή ετήσια αύξηση για το επιτρεπόμενο έσοδο του ΔΕΔΔΗΕ- Στα 1,12 δις ευρώ για το 2026

ΔΕΣΦΑ: Πράσινο φως για τον σταθμό της Βέροιας- Τα έργα που αλλάζουν τον χάρτη του φυσικού αερίου

ΔΕΣΦΑ: Πράσινο φως για τον σταθμό της Βέροιας- Τα έργα που αλλάζουν τον χάρτη του φυσικού αερίου

ΡΟΗ ΕΙΔΗΣΕΩΝ

Γιώργος Λυκοπάντης: Να διακοπούν όλες οι σχέσεις με το Ισραήλ

Πολιτική 15:40

Τι δείχνουν οι νέες δημοσκοπήσεις: ΝΔ δεν ανεβαίνει, δεύτερος Τσίπρας, μάχη για την τρίτη θέση ΠΑΣΟΚ- Καρυστιανού

Παιχνίδια Εξουσίας 15:38

ΑΑΔΕ: Παραβάσεις στο 26,5% των επιχειρήσεων που ελέγχθηκαν στην Αθηναϊκή Ριβιέρα

Οικονομία 15:36

«Έξυπνες» κάμερες και στον ΗΣΑΠ - Στόχος ο εντοπισμός επιβατών χωρίς εισιτήριο

Ελλάδα 15:25

Ιράν μετά τα πλήγματα στη Βηρυτό: «Οι ΗΠΑ και το Ισραήλ θα λογοδοτήσουν»

Διεθνή 15:12

Λέρος: Νεκρός 60χρονος ψαροντουφεκάς στην Αγία Μαρίνα

Ελλάδα 15:04
Όλες Οι Ειδήσεις

ΔΗΜΟΦΙΛΗ

Καστελόριζο: Ερευνητές μπήκαν σε σήραγγα βάθους 25 μέτρων και βρήκαν ένα άγνωστο είδος γρύλου

Επιστήμη 17:45

Έμμα: Πέθανε ο άντρας που έζησε τρία χρόνια με το ήπαρ της - Η συγκινητική ανάρτηση της μητέρας της

Ελλάδα 18:11

Σε καλοκαιρινή διάθεση η Δανάη Μπάρκα - Οι φωτογραφίες που ανέβασε από την παραλία

Life 16:33

Διπλάσιος χρόνος ζωής για ασθενείς με καρκίνο στο πάγκρεας με ένα μόνο χάπι - Τι δείχνει νέα μελέτη

Υγεία 18:45

Τζόκερ 31/5/26: Αυτοί είναι οι αριθμοί που κερδίζουν 1 εκατ. ευρώ

Ελλάδα 22:04
Ειδήσεις από την Περιφέρεια - σε συνεργασία με τα μεγαλύτερα ενημερωτικά μέσα της Περιφέρειας

# HOT TOPICS

  • ΚΑΙΡΟΣ
  • ΛΟΓΑΡΙΑΣΜΟΙ ΡΕΥΜΑΤΟΣ

ΤΙΜΕΣΠΡΟΪΟΝΤΩΝ ΕΝΕΡΓΕΙΑΣ

αναλύσεις & ρεπορτάζ
από την συντακτική ομάδα τουDnews

ΤΙΜΕΣ ΡΕΥΜΑ ΤΙΜΕΣ ΦΥΣ. ΑΕΡΙΟ

Σχετικά Άρθρα

Το WhatsApp λανσάρει ιδιωτικές «incognito» συνομιλίες με το AI chatbot του

Το WhatsApp λανσάρει ιδιωτικές «incognito» συνομιλίες με το AI chatbot του

Τεχνολογία 14.05.2026 08:57
Η Burger King θα ελέγχει με AI chatbot αν οι υπάλληλοι λένε «παρακαλώ» και «ευχαριστώ»

Η Burger King θα ελέγχει με AI chatbot αν οι υπάλληλοι λένε «παρακαλώ» και «ευχαριστώ»

Διεθνή 27.02.2026 09:53
Τα chatbots τεχνητής νοημοσύνης δεν είναι φίλοι σας, προειδοποιούν ειδικοί

Τα chatbots τεχνητής νοημοσύνης δεν είναι φίλοι σας, προειδοποιούν ειδικοί

Τεχνολογία 03.02.2026 09:41
Aγγελος - Eξάγγελος και η κολακεία του chatbot

Aγγελος - Eξάγγελος και η κολακεία του chatbot

Opinions 31.10.2025 06:27

NETWORK

Τα 30+ συμπτώματα της περιεμμηνόπαυσης που δεν πρέπει να αγνοείτε

Τα 30+ συμπτώματα της περιεμμηνόπαυσης που δεν πρέπει να αγνοείτε

healthstat.gr 06.01.2026 - 05:16
Τα ηλιακά πάρκα κάνουν πολλά περισσότερα από το να παράγουν απλώς ενέργεια

Τα ηλιακά πάρκα κάνουν πολλά περισσότερα από το να παράγουν απλώς ενέργεια

ienergeia.gr 05.30.2026 - 04:16
Εύκολες γαλλικές κρέπες: Η κλασική συνταγή που πρέπει να δοκιμάσετε

Εύκολες γαλλικές κρέπες: Η κλασική συνταγή που πρέπει να δοκιμάσετε

healthstat.gr 06.01.2026 - 03:27
Παράταση της διάρκειας υλοποίησης της επένδυσης στο Πρόγραμμα «Αλλάζω Συσκευή για τις Επιχειρήσεις»

Παράταση της διάρκειας υλοποίησης της επένδυσης στο Πρόγραμμα «Αλλάζω Συσκευή για τις Επιχειρήσεις»

ienergeia.gr 05.29.2026 - 14:33
7 διατάσεις και ασκήσεις για ανακούφιση από την ισχιαλγία

7 διατάσεις και ασκήσεις για ανακούφιση από την ισχιαλγία

healthstat.gr 06.01.2026 - 06:38
Πόσο κοστίζει πραγματικά το να αφήνετε τις συσκευές σας στην πρίζα

Πόσο κοστίζει πραγματικά το να αφήνετε τις συσκευές σας στην πρίζα

ienergeia.gr 05.30.2026 - 04:15
Μια μικρή ρύθμιση στο ψυγείο μπορεί να μειώσει τους λογαριασμούς ρεύματος

Μια μικρή ρύθμιση στο ψυγείο μπορεί να μειώσει τους λογαριασμούς ρεύματος

ienergeia.gr 05.30.2026 - 04:16
Πώς να κοιμηθείτε άνετα και να βελτιώσετε τον ύπνο σας το καλοκαίρι

Πώς να κοιμηθείτε άνετα και να βελτιώσετε τον ύπνο σας το καλοκαίρι

healthstat.gr 06.01.2026 - 03:45
Dnews

ΟΠΙΝΙΟΝ ΠΟΣΤ ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ Α.Ε. "OPINIONPOST" Διεύθυνση: Ιπποκράτους 2, Αθήνα, 10679, Ελλάδα
ΑΦΜ: 800961697 - ΔΟΥ: ΚΕΦΟΔΕ Αττικής
ΑΡ. ΓΕΜΗ: 145803601000
Τηλ: 210 3608484
E-mail: info@dnews.gr

Domain name: Dnews.gr (Dikaiologitika.gr)
Νόμιμος Εκπρόσωπος - Διευθύνων Σύμβουλος: Νίκος Ανδριόπουλος (andriopoulos@opinion-post.gr)
Ιδιοκτησία: OPINIONPOST A.E. - Μέτοχοι: ENERGY REGISTER Α.Ε. / Ανδριόπουλος Νικόλαος
Δικαιούχος Domain: OPINIONPOST A.E. - Διαχειριστής Domain: Σωτήρης Μπέσκος
Διευθυντής Ιστοσελίδας: Παναγιώτης Ευθυμιάδης
Διευθυντής Σύνταξης: Κώστας Σαρρηκώστας

  • ΤΑΥΤΟΤΗΤΑ
  • ΔΙΑΦΗΜΙΣΗ
  • ΟΡΟΙ ΧΡΗΣΗΣ
  • ΠΟΛΙΤΙΚΗ ΠΡΟΣΤΑΣΙΑΣ ΔΕΔΟΜΕΝΩΝ
  • ΠΟΛΙΤΙΚΗ ΑΠΟΡΡΗΤΟΥ
  • COOKIES
  • ΚΩΔΙΚΑΣ ΔΕΟΝΤΟΛΟΓΙΑΣ
  • ΟΛΕΣ ΟΙ ΕΙΔΗΣΕΙΣ
Μέλος ΕΝΕΔ

Copyright © 2011 - 2026 OpinionPost S.A. All rights reserved.

Developed by Nuevvo.

ΜΕΛΟΣ #242054 Μ.Η.Τ. Μέλος #242054 του Μ.Η.Τ.
  • Πολιτική
  • Οικονομία
  • Ελλάδα
  • Διεθνή
  • Life
  • Παιδεία
  • Υγεία
  • Αθλητισμός
  • Επιστήμη
  • Επιχειρήσεις
  • Θέσεις Εργασίας
  • Ο Πληροφοριοδότης
  • Παιχνίδια Εξουσίας
  • Τεχνολογία
  • Auto - Moto
  • Entertainment
  • Market Maven
  • News In English
  • Opinions
  • Ειδήσεις Από Την Περιφέρεια
  • Όλες οι Ειδήσεις
Games