תקרא קצת על HADOOPS וכמובן תבדוק מה עם AMAZON S3 ושאר השירותים עננים (לא שאני תומך בהם אבל זה יכול לחסוך) גם GOOGLE ENGINE כמובן
גם הייתי מציע לקרוא על ZEND SEARCH LUCENE ועל APACHE LUCENE
טוב אם כבר אז עד הסוף... תחפש קצת על NUTCH, SOLR, COMPASS, בעיקר נאצ'
אין לי כרגע זמן לכתוב אבל אני מבטיח לך שאם יש לך אנגלית בסיסית תצליח ללמוד הרבה עם כל הביטויים שציינתי כאן
אם יש בעיות אתה מוזמן לשאול