Pagina 1 din 1

PHP suficient de puternic pentru un motor de cautare

Scris: Lun Noi 19, 2007 9:20 pm
de eleron

Scris: Lun Noi 19, 2007 10:29 pm
de vectorialpx

Scris: Lun Noi 19, 2007 11:08 pm
de dechim

Scris: Mar Noi 20, 2007 10:13 am
de ShD
Ok evitand orice alt flame anterior am sa incerc sa iti raspund. Algoritmul motorului de cautare conteaza enorm. Indexarea ca si Google este cam dificila pentru ca desi se fac n speculatii si x afirma ca stiu sigur cum functioneaza, nimic nu merge in practica 100%.

Indexarea pentru 20-30 de pagini nu ar trebui sa fie foarte dificila dar e de preferat sa uiti de acest numar in momentul in care gandesti sistemul ca atunci cand te vei extinde sa nu te lovesti de probleme de pseudocod practic si algoritmica.

Limbaje care sa suporte astfel de cerinte sunt pe cat de multe pe atat de variate:

1. PHP - are absolut toate functiile necesare si este stabil pentru a extinde cam orice aplicatie pe el.
2. ASP[.]NET - platforma [.]NET 3.0 vine cu multe imbunatatiri in puncte cheie in cazul tau dar e mai greu in momentul in care vrei sa te mentii in legalitate daca nu iti permiti un MS SQL Server si un IIS.
3. RoR - dinamic, energic dar nu atat de popular deci va trebui sa mai scrii tu de mana una alta

Rezumat: orienteaza-te spre ce iti este mai familiar. Algoritmica iti va consuma mult timp si nu vrei sa dai si peste probleme de sintaxa.

Scris: Mar Noi 20, 2007 8:11 pm
de eleron

Scris: Vin Noi 23, 2007 2:47 am
de whooper
20-30 de website-uri iti pot genera o baza de date de cativa Gb la indexare. Sincer depinde de marimea site-urilor pe care le ai de indexat.

Puterea de indexare (cat de repede sunt indexate site-urile respective) este data in mod normal de webserverul pe care sunt hostate acele site-uri. PHP-ul ruland pe un hardware minim (un celeron cu 256 Mb RAM) este in masura sa ceara pagini mai repede decat pot fi ele servite de webserverele respective. Biblioteca CURL ajuta enorm ..

Nu poti garanta indexarea si ranking-ul cuvintelor similar cu Google, Yahoo etc pentru ca nu stii cum le fac ei.

Vei avea destule probleme sa indexezi informatia din PDF-uri, Excel-uri, Word-uri, MP3-uri, Flash-uri etc aflate pe site-urile respective. Daca se cere doar indexarea paginilor HTML, CSS, JS .. e simplu pentru ca ceea ce trebuie sa citesti e text.

Fii atent la portul pe care citesti informatia. HTTP-ul functioneaza implicit pe portul 80. Daca ai site-uri securizate, folosesti HTTPS (port 443).

Odata indexate informatiile, tot ce face search-ul tau sunt query-uri catre baza de date .. deci poti spune ca faci motorul de cautare in SQL, nu in PHP :)

Scris: Vin Noi 23, 2007 9:19 am
de vectorialpx
da... asta e ideea... nu pentru php trebuie sa-ti faci probleme ci pentru sgbd
documenteaza-te despre cat suporta si estimeaza cat ti-ar trebui

Scris: Vin Noi 23, 2007 10:36 am
de mihaitha
cu mysql 5 ar trebui sa ii fie suficient. din ce am citit despre el, a spart limita de 4 GB/baza de date prin introducerea partitionarii bazelor de date.

Scris: Vin Noi 23, 2007 10:51 am
de necenzurat
sau poti folosi http://www.sphider.eu/

Scris: Sâm Noi 24, 2007 6:41 am
de carco

Scris: Dum Noi 25, 2007 3:53 pm
de adix

Scris: Dum Noi 25, 2007 4:46 pm
de mihaitha

Scris: Dum Noi 25, 2007 5:12 pm
de necenzurat