Με αφορμή την Παγκόσμια Ημέρα της Ελληνικής Γλώσσας, το Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου Αθηνά ανακοινώνει την κυκλοφορία του Llama-Krikri-8B, ενός νέου μεγάλου γλωσσικού μοντέλου που έχει σχεδιαστεί ειδικά για την ελληνική γλώσσα, βασισμένο στο Llama 3.1-8B της Meta.
Το Llama-Krikri αποτελεί τη φυσική συνέχεια της προσπάθειας του ΙΕΛ να υποστηρίξει την ελληνική γλώσσα στην εποχή της τεχνητής νοημοσύνης, έπειτα από την επιτυχία του Meltemi, του πρώτου ανοιχτού μεγάλου γλωσσικού μοντέλου για την παραγωγή ελληνικών κειμένων. Με άδεια Llama 3.1 Community License Agreement, το Llama-Krikri ενδυναμώνει τόσο την ερευνητική κοινότητα όσο και τις επιχειρήσεις που επιθυμούν να αναπτύξουν τεχνολογίες αιχμής με επίκεντρο τη γλώσσα μας.
Κύρια χαρακτηριστικά του Llama-Krikri:
· Βασίζεται στο γλωσσικό μοντέλο Llama 3.1-8B της Meta και έχει εκπαιδευτεί σε μεγάλου όγκου ποιοτικά γλωσσικά δεδομένα, για να προσαρμοστεί στις ιδιαιτερότητες της ελληνικής γλώσσας.
· Διαθέτει 8 δισεκατομμύρια παραμέτρους, επιτρέποντας προηγμένες γλωσσικές δυνατότητες χωρίς υψηλές υπολογιστικές απαιτήσεις.
· Υποστηρίζει τόσο τη σύγχρονη ελληνική όσο και την αγγλική γλώσσα, ενώ επιπλέον μπορεί να επεξεργάζεται πολυτονικό κείμενο και αρχαία ελληνικά. Μπορεί επίσης να επεξεργαστεί κείμενα σε επτά ακόμα γλώσσες τις οποίες υποστηρίζει το Llama-3.1.
· Προσφέρει μήκος συμφραζομένων (context length) 128k tokens, σε σύγκριση με τα 8k tokens του Μελτεμιού, επιτρέποντας μεγαλύτερο εύρος κατανόησης και απαντήσεων.
· Σε σχέση με το Meltemi, παρουσιάζει σημαντικές βελτιώσεις στην ακρίβεια όσον αφορά την παραγωγή φυσικής γλώσσας αλλά και κώδικα, προσφέροντας αναβαθμισμένες δυνατότητες στους χρήστες του.
Το Llama-Krikri αποτελεί ένα σημαντικό βήμα προς την ενίσχυση της ελληνικής γλώσσας στον ψηφιακό κόσμο, συνδέοντας τη γλωσσική κληρονομιά με τις πιο σύγχρονες εξελίξεις της τεχνητής νοημοσύνης.
Μπορείτε να δοκιμάσετε το νέο μοντέλο στο https://chat.ilsp.gr ή να κατεβάστε από το Hugging Face (θεμελιώδες μοντέλο Llama-Krikri-8B-Base και διαλογικό μοντέλο Llama-Krikri-8B-Instruct).
Επικοινωνία: Ινστιτούτο Επεξεργασίας του Λόγου, Ερευνητικό Κέντρο Αθηνά Email: Αυτή η διεύθυνση ηλεκτρονικού ταχυδρομείου προστατεύεται από τους αυτοματισμούς αποστολέων ανεπιθύμητων μηνυμάτων. Χρειάζεται να ενεργοποιήσετε τη JavaScript για να μπορέσετε να τη δείτε. Ιστότοπος: www.ilsp.gr, www.athenarc.gr