הוסטס - פורום אחסון האתרים הגדול בישראל

הוסטס - פורום אחסון האתרים הגדול בישראל (https://hosts.co.il/forums/index.php)
-   פורום תיכנות (https://hosts.co.il/forums/forumdisplay.php?f=14)
-   -   קבלת מספר התוצאות בגוגל ב PHP (https://hosts.co.il/forums/showthread.php?t=82269)

RS324 10-05-10 22:42

XML HTTP REQUEST זה לא כשאתה מבקש דף ומקבל תוצאה של XML , הדבר שנשמע לי הכי קרוב למה שאמרת זה לעשות פוסט של XML לדף מסויים מעבר לזה לא מכיר את המושג וזה גם לא ממש משנה

לפותח האשכול, אל תתאמץ להתחבר ל API

בדיקת מיקום במנועי חיפוש באתר googletools כבר למעלה משנתיים ניגש בכל בדיקה ל 10 עמודים של גוגל (כי תצוגה של 10 תוצאות ו 100 תוצאות שונה - יש שינוי במיקומים) ולא הייתה בעיה איתו אפילו פעם אחת
ואין שם שום טריקים מיוחדים....

אז תרגיש חופשי לגשת לדף ה HTML ולהשיג את מה שאתה צריך.
תהנה

AlmogBaku 11-05-10 13:22

טוב שמע, חבל על הוויכוח. ביצוע פניה וקבל XML לא נקראת בשם שכתבת.
חבל פה על הוויכוח, המושג שציינת מתייחס באופן ישיר לאג'קס.

*לא מאמין לי? חפש בגוגל. ואין שום דבר רע בללמוד. להפך! כל יום לומדים משהו חדש =]

IgalSt 11-05-10 15:12

ציטוט:

נכתב במקור על ידי Baku (פרסם 763661)
טוב שמע, חבל על הוויכוח. ביצוע פניה וקבל XML לא נקראת בשם שכתבת.
חבל פה על הוויכוח, המושג שציינת מתייחס באופן ישיר לאג'קס.

*לא מאמין לי? חפש בגוגל. ואין שום דבר רע בללמוד. להפך! כל יום לומדים משהו חדש =]

אכן חבל על הויכוח וממש לא מפחד ללמוד. למען האמת בעבודה אני לומד כל יום :)
אבל שוב, המושג הזה היה קיים הרבה לפני שהטמיעו את המושג "AJAX" ומתייחס לביצוע בקשות בין בין קליינט לשרת ו/או בין שרת אחד לאחר.

intercooler3819 11-05-10 19:20

ציטוט:

נכתב במקור על ידי Exa.co.il (פרסם 762854)
איזה חלק ממה שאני אומר ולמה?
לכתוב פשוט "לא נכון" זה לחלוטין ריק מתוכן.
אם תסביר את עצמך, אשמח להסביר למה לדעתי אתה טועה או פשוט להסכים איתך.

בזה שלכתוב לא נכון זה ריק מתוכן אני מסכים פשוט חשבתי שזה מובן מאליו כי יש רק אמירה אחת...
"
כאשר אתה מבקש מהם עמוד HTML זה "עולה" הרבה יותר (תעבורה, זמן עיבוד לשרתים וכו') מאשר לקבל פלאט מה-API שזה data נקי."

זאת לא בהכרח הסיבה שגוגל מעדיפים שתשתמש ב API

פשוט הם רוצים לסווג את המשתמשים לקטגוריות.. ובתור מפתח ברגע שאתה משתמש ב API אתה מוגדר בטטסטיקות ובכל נתון שהם אוספים עליך בתור מפתח..

מבחינת התעבורה - זה ממש לא בהכרח פחות תעבורה ;)

IgalSt 12-05-10 11:37

ציטוט:

נכתב במקור על ידי nitsanbn (פרסם 763722)
בזה שלכתוב לא נכון זה ריק מתוכן אני מסכים פשוט חשבתי שזה מובן מאליו כי יש רק אמירה אחת...
"
כאשר אתה מבקש מהם עמוד HTML זה "עולה" הרבה יותר (תעבורה, זמן עיבוד לשרתים וכו') מאשר לקבל פלאט מה-API שזה data נקי."

זאת לא בהכרח הסיבה שגוגל מעדיפים שתשתמש ב API

פשוט הם רוצים לסווג את המשתמשים לקטגוריות.. ובתור מפתח ברגע שאתה משתמש ב API אתה מוגדר בטטסטיקות ובכל נתון שהם אוספים עליך בתור מפתח..

מבחינת התעבורה - זה ממש לא בהכרח פחות תעבורה ;)

אכן לא בהכרח יותר תעבורה, אך לדעתי כמות הטקסט שיש ב-XML יותר קטנה מכמות הטקסט שיש בעמוד html שמציג את אותו המידע, לרוב.

בכל אופן, כמו שציינת אכן ישנם שיקולים שונים נוספים של איסוף סטטיסטיקות, תיעדוף הבקשות ועוד. מה גם, שבעתיד הם יכולים לשנות את מבנה העמוד של תוצאות החיפוש ויהיה על המתכנת לכתוב מחדש חלק מהקוד שלו שמוציא את הנתונים שהוא רוצה, בעוד שה-API גם אם יתעדכן ושמור על תמיכה לאחור (בד"כ).
בכל אופן, לדעתי בתור מתכנת עדיף להשתמש ב-API שיוצר בדיוק בשבילך

hi_sorie 12-05-10 14:41

ווואי אתם רבים פה על שטויות ובקצב !

בקיצור לפותח האשכול...

תשתמש בפונקציה שקוראת קוד מקור לתוך משתנה

בביטוי רגולארי פשוט אתה שולף את מה שיש בין התגים של התוצאה ואחסן אותו איפה שתרצה.

גוגל לא יחסום אותך אם לא תריץ את זה כל דקה.

בכל מקרה במידה וכן אתה יכול לעשות ניטור IP ע"י שימוש בפרוקסי יש הרבה אתרים שמציעים את זה.

מעל 20 תגובות לדבר פשוט..

תתבגרו.

IgalSt 12-05-10 19:16

ציטוט:

נכתב במקור על ידי hi_sorie (פרסם 763838)
ווואי אתם רבים פה על שטויות ובקצב !
.....
מעל 20 תגובות לדבר פשוט..

תתבגרו.

מה יש?
דיון לגיטימי ולא "מריבה".
אני מאמין שיש כאן בסופו של דבר הרבה מידע שיכול להועיל לגולשים.

תרגע.

Shay Ben Moshe 12-05-10 22:39

ציטוט:

נכתב במקור על ידי hi_sorie (פרסם 763838)
ווואי אתם רבים פה על שטויות ובקצב !

בקיצור לפותח האשכול...

תשתמש בפונקציה שקוראת קוד מקור לתוך משתנה

בביטוי רגולארי פשוט אתה שולף את מה שיש בין התגים של התוצאה ואחסן אותו איפה שתרצה.

גוגל לא יחסום אותך אם לא תריץ את זה כל דקה.

בכל מקרה במידה וכן אתה יכול לעשות ניטור IP ע"י שימוש בפרוקסי יש הרבה אתרים שמציעים את זה.

מעל 20 תגובות לדבר פשוט..

תתבגרו.

תגובות כמו זו זה בדיוק מה שמשאיר מתכתנים מאחור.

אם תפתח את הראש ללמידה ותיהיה מוכן לקבל את זה שיש דרכים יותר נכונות ופשוטות לבצע את המשימה רק תתקדם מזה הלאה.
קריאה של XML היא הרבה יותר פשוטה ולרוב גם לא משתנה, קריאה של עמוד HTML שמלא ב"זבל" פשוט לא נכונה פה. מה גם שגוגל מייעדים את הAPI שלהם בדיוק למפתחים שכמונו ולא את עמוד החיפוש הרגיל.

חבל.

hi_sorie 12-05-10 22:52

ציטוט:

נכתב במקור על ידי Shay Falador (פרסם 763921)
תגובות כמו זו זה בדיוק מה שמשאיר מתכתנים מאחור.

אם תפתח את הראש ללמידה ותיהיה מוכן לקבל את זה שיש דרכים יותר נכונות ופשוטות לבצע את המשימה רק תתקדם מזה הלאה.
קריאה של XML היא הרבה יותר פשוטה ולרוב גם לא משתנה, קריאה של עמוד HTML שמלא ב"זבל" פשוט לא נכונה פה. מה גם שגוגל מייעדים את הAPI שלהם בדיוק למפתחים שכמונו ולא את עמוד החיפוש הרגיל.

חבל.

תגיד לי אתה מדבר ברצינות ?

נראה לך שיש פה איזה לולאה עם סיבוכיות או איזה תהליך כבד?

לא משנה כמה כבד הדף של גוגל ( למרות שזה כלום לא עובר את 100KB ) אף שרת לא יפול ושום דבר לא יקרה, לא פסלתי את הדרך שלך, שימוש ב API לפעמים זה דבר נכון לעשות, אבל אני לא רואה פה צורך בזה, לא מתעסקים פה עם הרבה מידע או לולאות ועל כן אני קובע ש 2 הדרכים נכונות יעילות מהירות וכשרות - הדרך של לאנקלד את הדף תהיה הרבה יותר קלה למתכנתים מתחילים.

חוץ מזה שאני יכול להראות לך שהכלי של גוגל למפתחים עבור קריאת PR של אתר התשנה לו הכתובת אחרי זמן מסויים, אז יותר טוב לקרוא מהמקור את המידע, שמחר כתובת ה XML לא תשתנה.

וזה ממש לא משאיר מתכנתים "מאחור", אל תתפלצן עלי.

Shay Ben Moshe 12-05-10 22:57

חי דבר ראשון הכנסת פה מושגים של סיבוכיות מהירות ותחזוק שרתים. זה לא הנושא שדיברתי עליו, מבחינת ביצועים אני מסכים שהביצועים יהיו מאוד דומים.

מצד שני, לעשות file_get_contents ולהריץ ביטוי רגולרי שמישהו יכתוב פה בהמשך זה לא הכי מלמד את המתכנת ולמעשה ביטוי רגולרי על כזה דבר זה גם לא כל כך יעיל.
מצד שלישי, לשאוב XML יפה, להשתמש במחלקה כמו SimpleXML בשביל לנווט בה בנוחות ולרוץ על התוצאות בצורה שלשמה זה נבנה זה הרבה הרבה יותר נוח והרבה יותר ניתן לתחזוקה ולשינויים.

למה אתה רב על משהו שאתה יודע שהוא נכון? הרי ברור לך שהדרך הנכונה היא להשתמש בAPI של גוגל. אם זו תוכנית של 5 דקות בשביל משחק באמת אין סיבה גם לדעתי להתחיל להשתמש בAPI כיוון שזה דורש כמה הכנות אבל אני יוצא מתוך נקודת הנחה שזה לא המקרה.


כל הזמנים הם GMT +2. הזמן כעת הוא 21:34.

מופעל באמצעות VBulletin גרסה 3.8.6
כל הזכויות שמורות ©
כל הזכויות שמורות לסולל יבוא ורשתות (1997) בע"מ