1. Ταυτότητα Μαθήματος:
Τίτλος μαθήματος: Ανάκτηση Πληροφοριών στο Διαδίκτυο
Εξάμηνο διδασκαλίας: 2ο
Ώρες εβδομαδιαίως: 3
Μονάδες ECTS: 6
2. Μαθησιακοί Στόχοι:
Να αναπτύξει την κατανόηση και την πρακτική εξάσκηση των τεχνικών στατιστικής φυσικής επεξεργασίας γλώσσας καθώς και ανάκτησης & επεξεργασίας πληροφοριών που θα υποστηρίξουν την σχεδίαση και ανάπτυξη προηγμένων διαδικτυακών συστημάτων & υπηρεσιών.
3. Αντικείμενο του μαθήματος:
- Κατανόηση τρόπου λειτουργίας μηχανών αναζήτησης
- To «κρυφό» web (hidden, invisible web) τρόποι επεξεργασίας & ανάκτησης πληροφοριών σε αυτό
- Βασικές αρχές στατιστικής επεξεργασίας φυσικής γλώσσας
- Βασικές αρχές ανάκτησης πληροφοριών
- Μηχανές αναζήτησης
- Βασικές αρχές-προβλήματα κατανεμημένης ανάκτησης πληροφοριών
- Το πρόβλημα της εύρεσης και αντιπροσώπευσης ιστοθέσεων στο διαδίκτυο
- Το πρόβλημα της επιλογής πηγών πληροφοριών στο διαδίκτυο
- Το πρόβλημα της σύνθεσης αποτελεσμάτων από πολλές πηγές πληροφοριών στο διαδίκτυο
- Αναζήτηση σε peer-to-peer δίκτυα
- Social Search – Semantic Search
4. Διδακτική Μέθοδος
Διαλέξεις υποστηριζόμενες από διαφάνειες και άλλο εκπαιδευτικό υλικό (3 ώρες/εβδομάδα),
Ασκήσεις Πράξεις (2 ώρες/εβδομάδα),
Εργαστηριακές ασκήσεις (1 ώρες/εβδομάδα)
5. Μέθοδος αξιολόγησης φοιτητών
Γραπτές εξετάσεις και εργασίες (άσκηση/πράξη). Ανάπτυξη μίας μηχανής αναζήτησης ως πρακτική εργαστηριακή άσκηση.
6. Απαιτήσεις εξοπλισμού – λογισμικού
Ο εξοπλισμός που απαιτείται για την εκπαίδευση των φοιτητών σε εργαστηριακό περιβάλλον παρέχεται από το τμήμα πληροφορικής και τα εργαλεία που θα χρησιμοποιηθούν ανήκουν κυρίως στην κατηγορία του ελεύθερου η/και ανοικτού λογισμικού
7. ΠροτεινόμενηΒιβλιογραφία
- Understanding Search Engines : Mathematical Modeling and Text Retrieval (Software, Environments, Tools) by Michael W. Berry, Murray Browne Paperback (June 1999) Society for Industrial & Applied Mathematics; ISBN: 0898714370
- Finding Out About: A Cognitive Perspective on Search Engine Technology and the WWW (With CD-ROM) by Richard K. Belew, C. J. Van Rijsbergen Hardcover – 325 pages Bk&Cd-Rom edition (February 15, 2001) Cambridge University Press; ISBN: 0521630282 ; Dimensions (in inches): 0.94 x 9.57 x 7.28
- Natural Language Processing for Online Applications: Text Retrieval, Extraction, and Categorization (Natural Language Processing, 5) by Peter Jackson, Isabelle Moulinier Paperback: 225 pages ; Dimensions (in inches): 0.50 x 8.50 x 6.00 Publisher: John Benjamins Publishing Co.; (July 2002) ISBN: 1588112500
- Foundations of Statistical Natural Language Processing by Christopher D. Manning (Author), Hinrich Schόtze (Author) Hardcover: 620 pages ; Dimensions (in inches): 1.80 x 9.31 x 8.15 Publisher: MIT Press; 1st edition (June 18, 1999) ISBN: 0262133601
- Korfhage, Robert F., 1997 “Information Storage and Retrieval” Wiley Computer Publishing. New York, ISBN 0-471-14338-3
- van Rijsbergen C. J. (1979) “Information Retrieval” London: Butterworths, (available on-line on 25th March 1999 at: http://www.dcs.gla.ac.uk/Keith/Preface.html)
- Baeza-Yates R. and Ribeiro-Neto B. (1999) “Modern Information Retrieval” Addison-Wesley Harlow UK ISBN 0-201-39829-X (reviewed in http://faculty.washington.edu/tabrooks/Documents/baeza.htm)
- Frakes W.B. and Baeza-Yates R (eds.) (1992) “Information Retrieval: Data Structures and Algorithms” Prentice-Hall, ISBN 0-13-463837-9
- Large, Andrew, Lucy A., Tedd R.J., and Hartley R.J. 1999 “Information Seeking in the Online Age” Bowker SAUR London. ISBN 1-85739-260-4
- Spärck-Jones K. and Willett P. (1997) “Readings in Information Retrieval” Morgan Kaufmann ISBN 1-55860-454-5. 518.502975 S60
- Salton, G. and McGill, M. (1983), Introduction to Modern Information Retrieval. McGraw-Hill
- Kowalski, Gerald, “Information Retrieval Systems: Theory and Implementation” Kluwer Academic Publishers , Boston. Sunderland Class No. 518.361.Ko9
- Richard K. Belew “Finding Out About” Cambridge University Press, Cambridge, U.K., 2000. ISBN 0 521 63028