1. Preiei pagina (cu file_get_contents, fopen sau curl, care iti e mai usor si accesibil) :
http://www.google.ro/search?hl=ro&site=case&q=case
2. Vezi cum sunt aranjate elementele (in cazul google ai un <li class="g w0"> care marcheaza inceputul rezultatului).
Ai un <h3 class="r"> <a href="adresa site" class="l" onmousedown="blablabla"> titlu site </a></h3>
dupa care putin mai jos ai un
<div class="s"> descriere <br> (divul se termina ceva mai jos)
Deci practic ai de extras elementele respective.
3. Trebuie sa faci expresia regulata care sa extraga datele respective ... in cazul asta ar fi
preg_match_all("/<h3 class="r"><a href=\"(.*)\" (.*)>(.*)</a></h3>(.*)<div class=\"s\">(.*)<br>/",$variabila_in_care_tii_pagina_de_la_google,$array_final);
La asta ar trebui adaugati cativa parametri referitori la tipurile de caractere, cat de greedy sa fie, etc, dar in mare cam asta e.
Am pus cu bold sectiunile importante, anume link, titlu si descriere.
4. Adaugi valorile din $array_final in baza de date.