M204. Ανάκτηση Πληροφοριών στο Διαδίκτυο

1. Ταυτότητα Μαθήματος:

Τίτλος μαθήματος: Ανάκτηση Πληροφοριών στο Διαδίκτυο

Εξάμηνο διδασκαλίας: 2ο

Ώρες εβδομαδιαίως: 3

Μονάδες ECTS: 6

2. Μαθησιακοί Στόχοι:

Να αναπτύξει την κατανόηση και την πρακτική εξάσκηση των τεχνικών στατιστικής φυσικής επεξεργασίας γλώσσας καθώς και ανάκτησης & επεξεργασίας πληροφοριών που θα υποστηρίξουν την σχεδίαση και ανάπτυξη προηγμένων διαδικτυακών συστημάτων & υπηρεσιών.

3. Αντικείμενο του μαθήματος:

  • Κατανόηση τρόπου λειτουργίας μηχανών αναζήτησης
  • To «κρυφό» web (hidden, invisible web) τρόποι επεξεργασίας & ανάκτησης πληροφοριών σε αυτό
  • Βασικές αρχές στατιστικής επεξεργασίας φυσικής γλώσσας
  • Βασικές αρχές ανάκτησης πληροφοριών
  • Μηχανές αναζήτησης
  • Βασικές αρχές-προβλήματα κατανεμημένης ανάκτησης πληροφοριών
  • Το πρόβλημα της εύρεσης και αντιπροσώπευσης ιστοθέσεων στο διαδίκτυο
  • Το πρόβλημα της επιλογής πηγών πληροφοριών στο διαδίκτυο
  • Το πρόβλημα της σύνθεσης αποτελεσμάτων από πολλές πηγές πληροφοριών στο διαδίκτυο
  • Αναζήτηση σε peer-to-peer δίκτυα
  • Social Search – Semantic Search

4. Διδακτική Μέθοδος

Διαλέξεις υποστηριζόμενες από διαφάνειες και άλλο εκπαιδευτικό υλικό (3 ώρες/εβδομάδα),

Ασκήσεις Πράξεις (2 ώρες/εβδομάδα),

Εργαστηριακές ασκήσεις (1 ώρες/εβδομάδα)

5. Μέθοδος αξιολόγησης φοιτητών

Γραπτές εξετάσεις και εργασίες (άσκηση/πράξη). Ανάπτυξη μίας μηχανής αναζήτησης ως πρακτική εργαστηριακή άσκηση.

6. Απαιτήσεις εξοπλισμού – λογισμικού

Ο εξοπλισμός που απαιτείται για την εκπαίδευση των φοιτητών σε εργαστηριακό περιβάλλον παρέχεται από το τμήμα πληροφορικής και τα εργαλεία που θα χρησιμοποιηθούν ανήκουν κυρίως στην κατηγορία του ελεύθερου η/και ανοικτού λογισμικού

7. ΠροτεινόμενηΒιβλιογραφία

  • Understanding Search Engines : Mathematical Modeling and Text Retrieval (Software, Environments, Tools) by Michael W. Berry, Murray Browne Paperback (June 1999) Society for Industrial & Applied Mathematics; ISBN: 0898714370
  • Finding Out About: A Cognitive Perspective on Search Engine Technology and the WWW (With CD-ROM) by Richard K. Belew, C. J. Van Rijsbergen Hardcover – 325 pages Bk&Cd-Rom edition (February 15, 2001) Cambridge University Press; ISBN: 0521630282 ; Dimensions (in inches): 0.94 x 9.57 x 7.28
  • Natural Language Processing for Online Applications: Text Retrieval, Extraction, and Categorization (Natural Language Processing, 5) by Peter Jackson, Isabelle Moulinier Paperback: 225 pages ; Dimensions (in inches): 0.50 x 8.50 x 6.00 Publisher: John Benjamins Publishing Co.; (July 2002) ISBN: 1588112500
  • Foundations of Statistical Natural Language Processing by Christopher D. Manning (Author), Hinrich Schόtze (Author) Hardcover: 620 pages ; Dimensions (in inches): 1.80 x 9.31 x 8.15 Publisher: MIT Press; 1st edition (June 18, 1999) ISBN: 0262133601
  • Korfhage, Robert F., 1997 “Information Storage and Retrieval” Wiley Computer Publishing. New York, ISBN 0-471-14338-3
  • van Rijsbergen C. J. (1979) “Information Retrieval” London: Butterworths, (available on-line on 25th March 1999 at: http://www.dcs.gla.ac.uk/Keith/Preface.html)
  • Baeza-Yates R. and Ribeiro-Neto B. (1999) “Modern Information Retrieval” Addison-Wesley Harlow UK ISBN 0-201-39829-X (reviewed in http://faculty.washington.edu/tabrooks/Documents/baeza.htm)
  • Frakes W.B. and Baeza-Yates R (eds.) (1992) “Information Retrieval: Data Structures and Algorithms” Prentice-Hall, ISBN 0-13-463837-9
  • Large, Andrew, Lucy A., Tedd R.J., and Hartley R.J. 1999 “Information Seeking in the Online Age” Bowker SAUR London. ISBN 1-85739-260-4
  • Spärck-Jones K. and Willett P. (1997) “Readings in Information Retrieval” Morgan Kaufmann ISBN 1-55860-454-5. 518.502975 S60
  • Salton, G. and McGill, M. (1983), Introduction to Modern Information Retrieval. McGraw-Hill
  • Kowalski, Gerald, “Information Retrieval Systems: Theory and Implementation” Kluwer Academic Publishers , Boston. Sunderland Class No. 518.361.Ko9
  • Richard K. Belew “Finding Out About” Cambridge University Press, Cambridge, U.K., 2000. ISBN 0 521 63028
Skip to content