Περίληψη έργου
Μετά από πολλά χρόνια μελέτης, οι συλλογές τυπωμένων
και χειρόγραφων ιστορικών ελληνικών εγγράφων συνεχίζουν να είναι
σημαντική πηγή νέων πληροφοριών για τους μελετητές όσον αφορά την
ιστορία των παλαιότερων χρόνων καθώς και την δημιουργία της πολιτιστικής
τεκμηρίωσης κατά τη διάρκεια των αιώνων. Αν και η επιτυχής αναγνώριση
των Λατινικών τυπωμένων χαρακτήρων θεωρείται πλέον σε μεγάλο βαθμό
λυμένο ερευνητικό πρόβλημα, η αναγνώριση γραφών που έχουν μεγάλο αριθμό
διαφορετικών χαρακτήρων εξακολουθεί να είναι αντικείμενο ενεργού έρευνας.
Τα ιστορικά ελληνικά (πολυτονικά) έγγραφα έχουν μεγάλη ποικιλία
διακριτικών στοιχείων και σαν αποτέλεσμα μεγάλο αριθμό διαφορετικών
χαρακτήρων (περισσότερους από 270). Εξαιτίας αυτού, οι σύγχρονες
τεχνολογίες οπτικής αναγνώρισης χαρακτήρων
δεν μπορούν να επεξεργαστούν
με επιτυχία τα ελληνικά τυπωμένα και χειρόγραφα έγγραφα. Λαμβάνοντας
υπόψη ότι το ελληνικό πολυτονικό σύστημα χρησιμοποιούνταν από περίπου το
200 π.Χ. μέχρι τις σύγχρονες εποχές (μέχρι το 1982), μπορούμε εύκολα να
συμπεράνουμε ότι ένας μεγάλος αριθμός ψηφιοποιημένων ελληνικών εγγράφων
παραμένει ακόμα χωρίς δυνατότητες αναζήτησης πλήρους κειμένου. Στα
πλαίσια αυτά, στο έργο
OldDocPro, μία ομάδα ερευνητών με σημαντική
εμπειρία στην ψηφιακή επεξεργασία εγγράφων, δουλεύει
από κοινού και προσανατολίζει της
ερευνητικές της προσπάθειες στην αναγνώριση των ελληνικών τυπωμένων και
χειρόγραφων πολυτονικών εγγράφων. Η έρευνα κατευθύνεται
στην υποβοήθηση των κατόχων του ψηφιακού υλικού ώστε να
μετατρέψουν τις συλλογές των ιστορικών ελληνικών εγγράφων σε ψηφιακές
συλλογές με δυνατότητες
αναζήτησης πλήρους κειμένου χρησιμοποιώντας
καινοτόμες μεθόδους οπτικής αναγνώρισης χαρακτήρων. Σκοπός είναι η
προαγωγή του αντίστοιχου ερευνητικού πεδίου καθώς και η διευκόλυνση των
μελλοντικών προσπαθειών για την ψηφιοποίηση και επεξεργασία των
ιστορικών ελληνικών εγγράφων.
ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ
ΥΠΟΥΡΓΕΙΟ
ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ
ΓΕΝΙΚΗ
ΓΡΑΜΜΑΤΕΙΑ ΕΡΕΥΝΑΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ
ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ
ΔΡΑΣΗ
«ΑΡΙΣΤΕΙΑ ΙΙ»
|
|