הרשם שאלות ותשובות רשימת חברים לוח שנה הודעות מהיום

חזור   הוסטס - פורום אחסון האתרים הגדול בישראל > עיצוב גראפי, תכנות על כל שפותיו וקידום ושיווק אתרים > פורום תיכנות

   
|!|

השב
 
כלים לאשכול תצורת הצגה
ישן 04-03-15, 04:30   # 1
Tyler
חבר מתקדם
 
מיני פרופיל
תאריך הצטרפות: Jul 2013
הודעות: 417

Tyler לא מחובר  

Exclamation קבלת מידע מHTML ושמירתו בTXT/HTML כפלט

אני מעוניין להוציא את המידע מהעמוד הבא
https://ru.wikipedia.org/wiki/%D0%9A...B8%D1%82%D1%83

ציטוט:
Показано 200 страниц из 30 624, находящихся в данной категории.
תרגום: "מוצגים 200 שמות מתוך 30,624"

ציטוט:
(предыдущие 200) (следующие 200)

תרגום: (200 קודמים) (200 הבאים).

בכל עמוד יש 200 שמות של מעיינות.
יש בסה"כ 30,624 מעיינות.
זה יוצא משהו בסביבות ה153 דפים בסה"כ.

אני מעונין לכתוב קוד שיעבור על כל ה153 ויוציא מכל דף את ה200 שמות שמופיעים בו לתוך קובץ TXT או HTML.

לבסוף אני רוצה שייצא קובץ פלט עם כל ה30,624 שמות בו.

חשבתי להשתמש ב:
file_get_html אבל הסתבכתי קצת בעיקר בגלל שמדובר פה במספר דפים ולא בעמוד אחד שאני רוצה למשוך ממנו מידע. כלומר אני לא צריך רק למשוך את המידע מהעמוד, אלא למשוך ולעבור עמוד ולמשוך מהעמוד הבא וכך הלאה.

גם ניסיתי לחפש משהו בAPI של ויקיפדיה או בקבצי המסד שלהם (שמפורסמים לציבור ומעודכנים מידי יום), ניסיתי למצוא איזשהי דרך העברה לXML או משהו בסגנון ישירות מהאתר שלהם. לא הצלחתי למצוא שום דבר.

אשמח לעזרה, תודה.
__________________
facebook api, js, cpa, cpl, $$$
--------------------
שלח לי הודעה פרטית.
  Reply With Quote
ישן 05-03-15, 17:58   # 2
meshuga
הנהלת הפורום לשעבר
 
meshuga's Avatar
 
מיני פרופיל
תאריך הצטרפות: Oct 2005
גיל: 34
הודעות: 7,601

meshuga לא מחובר  

תעשה דף PHP שמשתמש בfile_get_html
במקביל, דף HTML שעם AJAX מוסר לו לאיזה דף לגשת, ברגע שהוא מקבל תשובה שהוא סיים עם הדף הנוכחי, בAJAX תשלח אותה בקשה, עם העמוד הבא (או אם צריך גם תחזיר לו לאיזה עמוד לגשת...)...
(בהנחה שבדף PHP לכל עמוד אתה מפרק ומכניס לDB משלך)
  Reply With Quote
ישן 05-03-15, 18:22   # 3
Tyler
חבר מתקדם
 
מיני פרופיל
תאריך הצטרפות: Jul 2013
הודעות: 417

Tyler לא מחובר  

ציטוט:
נכתב במקור על ידי meshuga צפה בהודעה
תעשה דף PHP שמשתמש בfile_get_html
במקביל, דף HTML שעם AJAX מוסר לו לאיזה דף לגשת, ברגע שהוא מקבל תשובה שהוא סיים עם הדף הנוכחי, בAJAX תשלח אותה בקשה, עם העמוד הבא (או אם צריך גם תחזיר לו לאיזה עמוד לגשת...)...
(בהנחה שבדף PHP לכל עמוד אתה מפרק ומכניס לDB משלך)
תודה אני אנסה את זה למרות שזה נראלי מסובך מידי ואולי גם לא יעבוד.
יש מישהו שהמליץ לי לי להשתמש בפונקציה של xpath במקביל עם הgoogle docs ולהעביר הכל לדף של אקסל איכשהו.
__________________
facebook api, js, cpa, cpl, $$$
--------------------
שלח לי הודעה פרטית.
  Reply With Quote
ישן 06-03-15, 13:07   # 4
meshuga
הנהלת הפורום לשעבר
 
meshuga's Avatar
 
מיני פרופיל
תאריך הצטרפות: Oct 2005
גיל: 34
הודעות: 7,601

meshuga לא מחובר  

ציטוט:
נכתב במקור על ידי Tyler צפה בהודעה
תודה אני אנסה את זה למרות שזה נראלי מסובך מידי ואולי גם לא יעבוד.
יש מישהו שהמליץ לי לי להשתמש בפונקציה של xpath במקביל עם הgoogle docs ולהעביר הכל לדף של אקסל איכשהו.
זה לא מסובך ואני לא רואה למה שלא יעבוד...אם אתה יודע JQUERY זה ממש כמה שורות בJS..
ובPHP זה גם קצת (תלוי איך אתה מפרק את המידע שם...קצת ביטויים רגולרים...לא ממש סיפור)
  Reply With Quote
השב

חברים פעילים הצופים באשכול זה: 1 (0 חברים ו- 1 אורחים)
 


חוקי פירסום
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is מופעל
סמיילים הם מופעל
[IMG] קוד מופעל
קוד HTML מכובה

קפיצה לפורום


כל הזמנים הם GMT +2. הזמן כעת הוא 16:01.

מופעל באמצעות VBulletin גרסה 3.8.6
כל הזכויות שמורות ©
כל הזכויות שמורות לסולל יבוא ורשתות (1997) בע"מ