OldDocPro: Καινοτόμες Τεχνικές για την Αναγνώριση Ιστορικών Ελληνικών Εγγράφων


Home
Ομάδα Έργου
Νέα
Δημοσιεύσεις
Πληροφορίες

Περίληψη έργου

Μετά από πολλά χρόνια μελέτης, οι συλλογές τυπωμένων και χειρόγραφων ιστορικών ελληνικών εγγράφων συνεχίζουν να είναι σημαντική πηγή νέων πληροφοριών για τους μελετητές όσον αφορά την ιστορία των παλαιότερων χρόνων καθώς και την δημιουργία της πολιτιστικής τεκμηρίωσης κατά τη διάρκεια των αιώνων. Αν και η επιτυχής αναγνώριση των Λατινικών τυπωμένων χαρακτήρων θεωρείται πλέον σε μεγάλο βαθμό λυμένο ερευνητικό πρόβλημα, η αναγνώριση γραφών που έχουν μεγάλο αριθμό διαφορετικών χαρακτήρων εξακολουθεί να είναι αντικείμενο ενεργού έρευνας. Τα ιστορικά ελληνικά (πολυτονικά) έγγραφα έχουν μεγάλη ποικιλία διακριτικών στοιχείων και σαν αποτέλεσμα μεγάλο αριθμό διαφορετικών χαρακτήρων (περισσότερους από 270). Εξαιτίας αυτού, οι σύγχρονες τεχνολογίες οπτικής αναγνώρισης χαρακτήρων δεν μπορούν να επεξεργαστούν με επιτυχία τα ελληνικά τυπωμένα και χειρόγραφα έγγραφα. Λαμβάνοντας υπόψη ότι το ελληνικό πολυτονικό σύστημα χρησιμοποιούνταν από περίπου το 200 π.Χ. μέχρι τις σύγχρονες εποχές (μέχρι το 1982), μπορούμε εύκολα να συμπεράνουμε ότι ένας μεγάλος αριθμός ψηφιοποιημένων ελληνικών εγγράφων παραμένει ακόμα χωρίς δυνατότητες αναζήτησης πλήρους κειμένου. Στα πλαίσια αυτά, στο έργο OldDocPro, μία ομάδα ερευνητών με σημαντική εμπειρία στην ψηφιακή επεξεργασία εγγράφων, δουλεύει από κοινού και προσανατολίζει της ερευνητικές της προσπάθειες στην αναγνώριση των ελληνικών τυπωμένων και χειρόγραφων πολυτονικών εγγράφων. Η έρευνα κατευθύνεται στην υποβοήθηση των κατόχων του ψηφιακού υλικού ώστε να μετατρέψουν τις συλλογές των ιστορικών ελληνικών εγγράφων σε ψηφιακές συλλογές με δυνατότητες αναζήτησης πλήρους κειμένου χρησιμοποιώντας καινοτόμες μεθόδους οπτικής αναγνώρισης χαρακτήρων. Σκοπός είναι η προαγωγή του αντίστοιχου ερευνητικού πεδίου καθώς και η διευκόλυνση των μελλοντικών προσπαθειών για την ψηφιοποίηση και επεξεργασία των ιστορικών ελληνικών εγγράφων.

thireos

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ

ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΕΡΕΥΝΑΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ

 

europe-small

ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ

 

logo_ESPA-EKT

ΔΡΑΣΗ ΑΡΙΣΤΕΙΑ ΙΙ
 

Χρονοδιάγραμμα:

  • 01/03/2014: Εκκίνηση του έργου
  • 30/11/2014: Αρχική έκδοση εργαλείων προ-επεξεργασίας και κατάτμησης
  • 31/01/2015: Αρχική έκδοση εργαλείων αναγνώρισης, εντοπισμού λέξεων και μετα-επεξεργασίας.
  • 31/10/2015: Τελική έκδοση εργαλείων αναγνώρισης και εντοπισμού λέξεων - Λήξη του έργου

 


Home | Ομάδα Έργου | Νέα | Δημοσιεύσεις | Πληροφορίες

 Για περισσότερες πληροφορίες [Αποστολή email].
Τελευταία ενημέρωση: 30-10-2015.