Crawl site và lấy email trên site

Mình sẽ hướng dẫn các bạn crawler một website để lấy email tương tự với bài lấy số điện thoại :

Ở bài hướng dẫn này mình sẽ sử dụng thư viện rất hữu ích của php đó là thư viện PHPCrawl.

– Các bạn vào link : ‘phpcrawl.cuab.de’  để tải thư viện PHPCrawl về.

– Các bạn cần thêm file “simple_html_dom.php” vào thư viện này (link download: http://sourceforge.net/projects/simplehtmldom/files/ )

-Giải nén file zip ra.

-Và up lên host của bạn

Các bạn cần phải include file html_dom ra:

– Sau đó ta thêm một hàm tìm kiếm email đơn giản để get email từ website về

- Để in ra email các bạn thêm dòng code sau:

Vì vậy ta có đầy đủ file example như sau:

Các bạn có thể tham khảo thêm tại:

http://simplehtmldom.sourceforge.net/

http://phpcrawl.cuab.de/

You may also like...

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">