![]() |
האם יש פה מישהו שיודע לבנות רובוטים?
האם יש פה מישהו שיודע לבנות רובוטים?
למנועי חיפוש וכו'. GOOGLEBOT לדוגמא.. משהו שמחפש ברשת האתרים.. מישהו יודע לבנות \ איך בונים דבר כזה??? |
חעח
GOOGLEBOT זה מחשב עם תוכנה מחשב ממש חזק עם מעבד סוס בלי מערכת הפעלה אפילו אני מתאר לעצמי (או אולי אם.. O.o) שמריץ חיפוש.. בקיצור, תוותר. |
ציטוט:
זה מערך של 100 אלף מחשבים.. |
אני יכול לבנות עכביש (spider) ואולי איזה מערכת שתאנדקס לך מידע (בעזרת index server), בחינם אפילו (בשביל האתגר נו מה? |קורץ|). אתה מסדר את ה cluster??
|
ציטוט:
|
ציטוט:
שים לב שזה מעודכן לשנת 2004 בלבד (נלקח מאתר מורנו'ס) www.google.com/bot.html |
אני לא כ"כ מתעניין בגוגל ברמה כזאת, אבל ידעתי שזה מעל 50 אלף... אבל המרחק בין 50, או אפילו 60 ל-100 אלף הוא בהחלט גדול, במיוחד כשמדובר במספרים כאלה...
|
אני לא מתכווון לעשות GOOGLE2 ..
LOL אני רוצה רוצה לנסות ולהתקדם עם מערכת חיפוש אתרים קטנה בעזרת רובוט. ומי שיכול לעזור לי (אלעד) בבקשה תעזרו לי.. |
מצאתי את זה וזה די מעניין חחח..
http://www.robotstxt.org/wc/active/html/index.html הרבה סוגי רובוטים |
אין לי כוח כרגע לבנות משהו
מחר בבוקר אני אשרבט איזה עכביש ואני אפרסם את הקוד שלו |
ד"א
באיזה שפה זה? c? c+? c++? VB? .net? |
ציטוט:
נילקח מיפה: http://www.k.co.il/google-seo/google's-search-engine-overview/4/ ותאמין לי שהם יודעים מה הם אומרים. ועם כול השירותים שגוגל הוסיפו בשנתיים האחרונות תיהיה בטוח שהם עברו את ה 100 אלף שרתים. ציטוט:
סתם בה לי לנסות ולהתנסות בעוד דברים;) |
חחחח נתחיל מזה שאין שפה כזאת C+...
ואני לא חושב שזה יהיה שווה משהו אם זה לא יהיה ב-c/cpp... |
אין C+???
תמיד חשבתי שיש.. אוקיי.. מישהו יודע פה איך עושים דבר כזה בכלל?? אני צריך רק שזה יעשה את הדבר הבא. 1 אם זה נכנס לדף כלשהו זה מכניס את הדף למסד 2 אם בדף יש לינק זה נכנס ללינק 3 מוסיף את הדף של הלינק וזה חוזר חלילה. |
עשיתי WebSpider לכתובות אימייל פעם... אבל לא חושב שיש לי את הקוד עדיין...
|
אתה מתכנת C\CPP??
כתוב שאתה מתכנת PHP \ ASP .. אפשרי גם בהם? |
דוגרי אלעד,
איזה שפה? לפני שאתה הולך לישון xD |
ציטוט:
אי אפשר להריץ תוכנה כזאת מסקריפט PHP, כי השרת יהרוג את התהליך (עניין של קונפיגורציה, בררת המחדל היא 5 דקות) כשההגבלת זמן תגמר... |
אממ... מחר מישהו יכול לעזור לי בזה?.
רק שיביא לי מחר את הסקריפט הכללי (והעובד) של זה |
לפי מה שאני יודע(נזכרתי עכשיו) אפשר לעשות ב ASP ע"י נאוביקט XMLHTTP(ניראה לי קוראים לו ככה, לא זוכר, לא השתמשתי בו בחיים).
הוא מעתיק את קוד המקור של העמוד ממקומות מוגדרים לו, ואז אפשר לבצע י" פונקציות שבונים חיפוש בקוד המקור הזה, ואפשר כמובן גם לשמור אותו במסד. רק שזה תהליך ארוךךךך ואיטיייי.. בגלל זה לא ניראה לי שמשתמשים בסופו של דבר באוביקט הזה.. |
ציטוט:
עריכה: איזה על כל האינטרנט? לא תעבור 0.001 אחוז... |
ציטוט:
רק שזה מיגע לחכות 6 שניות,5 שניות בלי לראות תוצאות..(בדרך כלל TIME OUT(ברירת מחדל) זה 20 שניות). אבל יכול להיות שזה קרה לי בגלל שאין לי מושג בשימוש באוביקט הזה, וסתם כתבתי משהו שניראה לי סתם "עיצבן" את השרת, אני בטוח שאם אלעד או כל תכנת אחר שמיומן ויודע יותר ממני(במיוחד באוביקט הזה), יכול להשתמש באוביקט הזה רק שזה ירוץ יותר מהר.). |
ציטוט:
|
אי אפשר לעשות שזה יהרוס לאחר זמן ממשוך?
על תנאי? |
לא... סקריפט ב-PHP גם יהיה חלש מדיי, לא מספיק יציב...
תוכנה ב-C תהיה יותר חזקה ויציבה... |
ניר זה לא נכון
הרי זה גם יכול להפסיק אחרי שעה תלוי מה הTIMEOUT המוקצב לו, אם בכלל, יש שרתים בלי TIMEOUT (כמעט ואין, הרוב זה 30 שניות) |
אמרת את זה בעצמך... נתן לו שעה אפילו, נראה לך שהסקריפט יעבור על אחוז כל שהוא מהאינטרנט?
|
איך עושים? די בקלות האמת היא..
אני בונה סקריפט קטן (סה"כ סביבות ה 100-200 שורות בלבד) שבנוי ב ASP (עם Jscript בצד שרת, אבל אפשרי גם עם Vbscript מן הסתם אבל זה יהיה קצת איטי יותר) אני מזין למערכת כתובת של אתר גדול, נניח בתור התחלה www.walla.co.il בעזרת xmlHTTP אני נכנס לעמוד ומחפש אחרי הביטוי הזה: קוד:
<a _____ href=" XXXXX " ____> ___ </a> ואז אני פשוט קורא לפונקציה ברקורסיה שתתחיל להיכנס גם לתת - קישורים (נניח www.walla.co.il/bla/bla.asp) ותיכנס גם לתת - תת קישורים וכך הלאה עד אינסוף אני מתבסס על העובדה שסביר להניח שלפחות קישור אחד מוואלה מפנה לאתר אחר (נניח לצורך הדוגמא ynet) ואז המערכת תיכנס ל ynet ותתחיל לעבור על כל הקישורים ב ynet (ושוב אני מתבסס על העובדה שסביר להניח שלפחות קישור אחד מ Ynet מכוון לאתר אחר) וכך הלאה והלאה ובעצם אין לזה סוף איך אני מאנדקס את המידע? משתמש באופציה נחמדה שקיימת בשרת windows שנקראית index server ומאפשרת לי לאנדקס דפים ולחפש בהם בשניות כדי להריץ סקריפט כזה עם אינסוף רמות צריך כמה מחשבים די חזקים .. |
כל הזמנים הם GMT +2. הזמן כעת הוא 02:17. |
מופעל באמצעות VBulletin גרסה 3.8.6
כל הזכויות שמורות ©
כל הזכויות שמורות לסולל יבוא ורשתות (1997) בע"מ