| Subiectul anterior :: Subiectul următor |
| Autor |
Mesaj |
crs12decoder
Data înscrierii: 31/Mar/2008
Mesaje: 14
|
| Trimis: Lun Mar 31, 2008 2:21 pm Titlul subiectului: preluare html |
|
|
| sal all... am si eu 1 mica problema... mica dar complicata... sa zicem ca exista un site care posteaza stiri zilnic... sau horoscop sau... ceva de genu asta... in orice caz exista acolo o informatie cu un update zilnic... exista vreo posibilitate ca eu sa pot sa preiau acea informatie zilnica si s-o pun la mine pe site?, facandu-si update de fiecare data cand site-ul original isi face update?daca da... cum? va multumesc anticipat :-s |
|
| Sus |
|
saitek
Data înscrierii: 23/Sep/2007
Mesaje: 423
|
| Trimis: Lun Mar 31, 2008 2:34 pm Titlul subiectului: |
|
|
| Daca nu ai la dispozitie un xml, faci cu cURL sau cu file_get_contents . |
|
| Sus |
|
crs12decoder
Data înscrierii: 31/Mar/2008
Mesaje: 14
|
| Trimis: Lun Mar 31, 2008 3:11 pm Titlul subiectului: |
|
|
| da... am incercat cu file_get_contents .. ideea e ca imi ia tot site-ul si nu stiu exact cum l-as putea "sectiona" in asa fel incat sa imi arate doar ce ma intereseaza pe mine :-? |
|
| Sus |
|
mihaitha
Data înscrierii: 04/Mai/2007
Mesaje: 1155
Locație: Sibiu
|
| Trimis: Lun Mar 31, 2008 3:19 pm Titlul subiectului: |
|
|
| ori cu expresii regulate, ori hardcodezi scriptul sa iti afiseze numai sectiunile ce te intereseaza. Either way, depinzi de codul HTML al paginii din care iti preiei informatia. Daca schimba ei ceva, trebuie sa iti rescrii codul. |
|
| Sus |
|
crs12decoder
Data înscrierii: 31/Mar/2008
Mesaje: 14
|
| Trimis: Lun Mar 31, 2008 4:13 pm Titlul subiectului: |
|
|
| ok.. hardcode... expresii regulate? cum cand adik.. ce... ce-s alea? |
|
| Sus |
|
saitek
Data înscrierii: 23/Sep/2007
Mesaje: 423
|
| Trimis: Lun Mar 31, 2008 4:39 pm Titlul subiectului: |
|
|
| Uite un exemplu de regexp ([0-9]+),cauta pe google http://www.google.com/search?hl=ro&q=php+regular+expression&btnG=C%C4%83utare&lr= |
|
| Sus |
|
Copyright
Data înscrierii: 17/Dec/2006
Mesaje: 851
Locație: Bucuresti
|
| Trimis: Lun Mar 31, 2008 5:08 pm Titlul subiectului: |
|
|
http://www.google.com/search?hl=ro&q=parsing+html+with+regular+expressions&btnG=C%C4%83utare&lr=
Later. |
|
| Sus |
|
gligor_ciprian
Data înscrierii: 31/Mar/2008
Mesaje: 3
|
| Trimis: Lun Mar 31, 2008 9:40 pm Titlul subiectului: |
|
|
| Scuze ca ma bag si eu in seama cu o problema ce nu tine de subiectul vostru! As vrea sa gasesc pe cineva care poate sa-mi creeze un site cu baza de date si conturi pt. vizitatori. Daca se poate sa spuneti si un pret (aproximativ) ar fi super |
|
| Sus |
|
drailean
Data înscrierii: 13/Mai/2006
Mesaje: 5
Locație: Bucuresti
|
| Trimis: Mar Apr 01, 2008 12:16 am Titlul subiectului: parsing html intr-un alt mod |
|
|
Scuze, am dat din greseala in PM ... mesajul original::
Cred ca mai degraba folosesti un DOM + XPath, e mult mai elegant si un pic mai rapid decat expressile regulate. Nu am la indemana nici un link, dar daca faci un pic de cautare pe google (cred ca si dupa "php + xpath") gasesti, eu tot la fel am pornit. Orium, e clar ca in toate situatiile vei depinde de codul din pagina sursa, trebuie doar sa mai verifici structura paginii din cand in cand (sau sa setezi o alerta in scriptul pe care probabil il agati in cron). |
|
| Sus |
|
crs12decoder
Data înscrierii: 31/Mar/2008
Mesaje: 14
|
| Trimis: Mar Apr 01, 2008 3:13 pm Titlul subiectului: |
|
|
e normal ca voi depinde de codul sursa... nici nu se mai pune in discutie treaba asta.. in orice caz... e legal ce as vrea sa fac :D:D:D... adica... daca pur si simplu creez o imagine a anumitei parti din continutul site-ului altcuiva care se auto-updateaza zilnic DAR scriu ca si provine din acel site original, pot patzi ceva?
oricum... m-am gandit la ceva... cum as putea sa fac ceva de genu:
[ignora toate liniile de cod de la 1 pana la 8, ia in considerare liniile 9,10,11 , ignora liniile de cod de la 11> pana la sfarsit]
nush exact exista vreo functie ceva care sa-mi ia in considerare doar anumite linii de cod dintr-un site? ca sa-mi fie mai simplu...? :-s |
|
| Sus |
|
vectorialpx
Data înscrierii: 01/Mar/2005
Mesaje: 2764
Locație: Targoviste City
|
| Trimis: Mar Apr 01, 2008 4:20 pm Titlul subiectului: |
|
|
| faci explode dupa "\n" si iei array[7] --> [10] ... daca esti sigur ca sunt linii :) |
|
| Sus |
|
drailean
Data înscrierii: 13/Mai/2006
Mesaje: 5
Locație: Bucuresti
|
| Trimis: Mie Apr 02, 2008 12:35 am Titlul subiectului: despre moralitate si legalitate |
|
|
Nu este neaparat legal sa copiezi continut din alt site pe situl tau. O varianta cat se poate de legala ar fi sa ceri un acord scris din partea acelui site pentru ca tu sa publici anumite informatii de la ei pe situl tau. Asta te-ar mai putea ajuta intr-un alt aspect: tinand cont de faptul ca tu ai sa tragi la pagini in permanenta de la ei, s-ar putea ca o persoana (de obicei un sysadmin) care analizeaza log-urile de trafic sa te "miroase" ca furi si sa-ti blockeze IP-ul (s-ar putea ca asta sa se intample chiar si automat, daca ei au un mod_security instalat acolo si cu o configuratie mai restrictiva). Daca iti blocheaza IP-ul intri in alte probleme. Dar daca ai acordul lor scris, eventual poti sa le spui ca pui link-uri din site-ul tau catre al lor, care ii vor ajuta si pe ei sa creasca un pic in rank, eu cred ca ai sanse sa faci ceva legal, curat.
Nu e neaparat vorba de legalitatea acelei actiuni, mai e si vorba de etica. Tu furi de pe un site. Probabil ca poti trai cu asta, poti dormi linistit. Dar sigur nu ai sa te simti decat atunci cand altcineva va face la fel de pe un site al tau, sa zicem un blog, un forum, unde tu te chinui sa muncesti niste articole/materiale, si altii profita de ele ... suna a legea copyright-ului, nu ? In mod cert la noi in tara nu ai sa ai repede probleme, dar e totusi mai bine sa dormi linistit. |
|
| Sus |
|
vectorialpx
Data înscrierii: 01/Mar/2005
Mesaje: 2764
Locație: Targoviste City
|
| Trimis: Mie Apr 02, 2008 12:36 pm Titlul subiectului: |
|
|
| total de acord... dar, oamenii nu mai stiu ce e etica si corectitudin :( |
|
| Sus |
|
crs12decoder
Data înscrierii: 31/Mar/2008
Mesaje: 14
|
| Trimis: Joi Apr 03, 2008 7:30 pm Titlul subiectului: |
|
|
e uite ca eu stiu... si chiar m-am gandit la asta... oricum fac asta din 2 motive:
1) ca sa am si eu ceva interesant pe site, evident
2) ca sa invat....
oricum cui i-ar conveni sa fie copiat de altu'... sa fim seriosi... oricum ma gandeam sa le trimit un e-mail mai multor site-uri de pe care pot lua informatii, pentru inceput o sa incerc sa imi fac si eu site-ul mai cunoscut ca sa vada ca pot reprezenta totusi o sursa de useri... si mi se pare normal sa le pun link-ul pe site avand in vedere ca e munca lor... un om a pierdut totusi timp ca sa scrie acolo chestiile alea... fie ele reale sau nu.. e o munca......
aveti cumva vreo idee cam cui as putea mai exact sa-i trimit un e-mail.. adica unui simplu admin nu am cum pentru ca el e pus acolo sa aiba grija de site si are niste reguli stricte.... deci nici nu s-ar pune problema.. totusi ownerii nu-si pun e-mailurile pe site-uri.. vreo idee? :-?..
ok.. ontopic(pana nu se enerveaza vreun admin si zice "da ce *(&*% &^%( de legatura are asta cu PHP bai &^*%% *&^)((^ ) :D...
ok faza cu liniile ar trebui sa mearga... o sa le incerc chiar acum.. inca o intrebare: eu ma refer la liniile de COD HTML scrise in spatele browserului... nu la liniile rezultate din HTML... ceea ce vezi in browser accesand site-ul... |
|
| Sus |
|
mihaitha
Data înscrierii: 04/Mai/2007
Mesaje: 1155
Locație: Sibiu
|
| Trimis: Sâm Apr 05, 2008 9:02 am Titlul subiectului: |
|
|
| Pai oricum, daca iei o pagina html cu wget sau cu file_get_contents sau whatever, o sa primesti un carnatz de cod html. Deci si octavian si cei ce ti-au raspuns tot la liniile alea se refereau. |
|
| Sus |
|
PHPRomania Bot
Bot Member
Data înscrierii: 27/Dec/2007
Mesaje: 1
Locaţie: Server Google |
| Trimis: Mie Dec 26, 2007 7:01 pm Titlul subiectului: Ad |
|
|
|
|
|
| Sus |
|
| |