CLARIN-EL – Ερευνητική Υποδομή CLARIN-EL

CLARIN-EL – Ερευνητική Υποδομή CLARIN-EL
Χρηματοδότηση
ΕΣΠΑ – ΕΠ «Ανταγωνιστικοτητα & Επιχειρηματικοτητα»
Διάρκεια
26/04/2013 - 30/09/2015
Περιγραφή

Το CLARIN EL αποτελεί το ελληνικό σκέλος του έργου CLARIN (www.clarin.eu), μιας πανευρωπαϊκής προσπάθειας να συγκεντρωθούν και να διατεθούν στην ερευνητική κοινότητα μέσω μιας διαδικτυακής Ερευνητικής Υποδομής (ΕΥ) γλωσσικοί πόροι (κείμενα, πολυμεσικά δεδομένα, λεξικά κτλ.) σε όλες τις γλώσσες, και εργαλεία γλωσσικής τεχνολογίας για την επεξεργασία τους (μορφολογικοί / συντακτικοί αναλυτές, εργαλεία επισημείωσης, στατιστικά εργαλεία κτλ.).

Η ΕΔΕΤ ΑΕ συμμετέχει στις δράσεις παροχής της ολοκληρωμένης υπολογιστικής υποδομής για τη φιλοξενία και διαχείριση της Ερευνητικής Υποδομής.

Οι εργασίες της ΕΔΕΤ ΑΕ επικεντρώθηκαν στη σχεδίαση και υλοποίηση της ερευνητικής υποδομής από κοινού με τους εταίρους ΕΚ «ΑΘΗΝΑ» και ΕΚΕΦΕ «ΔΗΜΟΚΡΙΤΟΣ».

  • Δυναμική εγκατάσταση και παραμετροποίηση του λογισμικού αποθετηρίων σε εικονικές μηχανές της υπηρεσίας ~okeanos με λογισμικό αυτοματοποιημένης εγκατάστασης (ansible playbooks )
  • Kαταγραφή της διαδικασίας και οδηγιών για την σύνδεση με το υποσύστημα πιστοποίησης χρηστών της ΕΔΕΤ
  • Προσαρμογή των μόνιμων αναγνωριστικών (PID) μέσω του EPIC GRNET REST API στο λογισμικό αποθετηρίων.
  • Αποθήκευση των πρωτογενών αρχείων των γλωσσικών πόρων στο υποσύστημα Pithos+ με τεχνικές Streaming Upload & Download για πολύ μεγάλα αρχεία.
  • Εγκατάσταση και χρήση του λογισμικού nagios ως εργαλείου παρακολούθησης της υποδομής.
  • Σχεδιασμός και προδιαγραφές για την επεξεργασία των γλωσσικών πόρων και τη χρήση εξειδικευμένου λογισμικού για αποθήκευση και επεξεργασία μεγάλου όγκου δεδομένων (Apache Hadoop)