Seminarium: Systemy Rozproszone
09 listopada 2006, godzina 12:15,
sala 3120
Tomasz Frydrychewicz
<t.frydrychewicz@mimuw.edu.pl>
Web crawlers - robaki internetowe
Plan prezentacji:
- Krótki rys historyczny
- Etykieta robaka internetowego (czyli co zrobic, żeby się nie narazić)
- Napotykane problemy
- Robaki rozproszone:
- Z centralnym zarządcą (zarządcami)
- Bez zarządcy
Literatura:
- Parallel crawlers, Cho, J. and Garcia-Molina, H. (2002)
- Design and implementation of a distributed crawler and filtering processor, Zeinalipour-Yazti, D. and Dikaiakos, M. D. (2002)
- Design and Implementation of a High-Performance Distributed Web Crawler, V. Shkapenyuk, T. Suel (2001)
- Guidelines for robots writers, Koster, M. (1993)
- Effective Web Crawling, Carlos Castillo (2004)
Serdecznie zapraszam.
Tomasz Frydrychewicz