Παρασκευή 3 Ιουλίου 2020

Η πλατφόρμα ECARLE στοχεύει στην ανάπτυξη ενός ολοκληρωμένου Software as a Service (SaaS) εργαλείου

Ecarle Project
Δεν υπάρχει διαθέσιμη περιγραφή για τη φωτογραφία.




 που θα χρησιμοποιείται από οργανισμούς και βιβλιοθήκες για να εμπλουτίσουν το ήδη ψηφιοποιημένο υλικό τους με επιπλέον μεταδεδομένα, όπως οι οντότητες και τα τοπωνύμια που εμφανίζονται στο κείμενο. Το SaaS εργαλείο δέχεται σαν είσοδο ψηφιοποιημένα τεκμήρια σε διαφορετικές μορφές (π.χ. TIFF, JPEG, PDF) καθώς και προαιρετικά την βιβλιοθηκονομική περιγραφή των τεκμηρίων και αναγνωρίζει το κειμενικό τους περιεχόμενο, το μετατρέπει σε επεξεργάσιμο κείμενο και το εμπλουτίζει αυτόματα με δομική και σημασιολογική πληροφορία, παράγοντας XML αρχεία, σύμφωνα με το διεθνές πρότυπο κωδικοποίησης κειμένων TEΙ. Ένας σημαντικός στόχος που έχει ήδη επιτευχθεί είναι η αυτόματη αναγνώριση ελληνικών χαρακτήρων στο πολυτονικό σύστημα γραφής. Με χρήση τεχνολογιών επεξεργασίας εικόνας και μηχανικής όρασης αντιμετωπίστηκαν διάφορα προβλήματα του φυσικού τεκμηρίου αλλά και της διαδικασίας της σάρωσης όπως φθορές, αλλοιώσεις, γραμμικές σκιάσεις, στρεβλώσεις κλπ. Μετά το τέλος της οπτικής αναγνώρισης χαρακτήρων δίνεται η δυνατότητα εξαγωγής του κειμένου αλλά και των μεταδεδομένων του σε διάφορες μορφές. Μεταξύ άλλων έχουν ήδη υλοποιηθεί διαδικασίες δημιουργίας έργων (projects) για την εύκολη διαχείριση τεκμηρίων, σύστημα μεταφόρτωσης και κατανεμημένης επεξεργασίας των τεκμηρίων με χρήση messaging τεχνολογιών όπως RabbitMQ, υποσύστημα εφαρμογής των τεχνικών μηχανικής μάθησης, περιβάλλον αναζήτησης και διαχείρισης της κατάστασης των τεκμηρίων, επεξεργαστής κειμένου TEI (Text Encoding Initiative), σύστημα διαδραστικών ειδοποιήσεων, πολυγλωσσικές διεπαφές καθώς και πίνακας ελέγχου με χρήσιμα στατιστικά στοιχεία για την πρόοδο των εργασιών.
https://www.facebook.com/1094991420656474/photos/a.1612237132265231/1612236978931913/?type=3&theater


Στο ερευνητικό έργο eCarle συμμετέχουν από πλευράς ΑΠΘ το Εργαστήριο Ευφυών Συστημάτων του Τμήματος Πληροφορικής, το Εργαστήριο Φιλολογίας και Νέων Τεχνολογιών του Τμήματος Φιλολογίας και η Βιβλιοθήκη & Κέντρο Πληροφόρησης.

Δεν υπάρχουν σχόλια: