Crawl site và lấy email trên site

Mình sẽ hướng dẫn các bạn crawler một website để lấy email tương tự với bài lấy số điện thoại :

Ở bài hướng dẫn này mình sẽ sử dụng thư viện rất hữu ích của php đó là thư viện PHPCrawl.

– Các bạn vào link : ‘phpcrawl.cuab.de’  để tải thư viện PHPCrawl về.

– Các bạn cần thêm file “simple_html_dom.php” vào thư viện này (link download: http://sourceforge.net/projects/simplehtmldom/files/ )

-Giải nén file zip ra.

-Và up lên host của bạn

Các bạn cần phải include file html_dom ra:

– Sau đó ta thêm một hàm tìm kiếm email đơn giản để get email từ website về

– Để in ra email các bạn thêm dòng code sau:

Vì vậy ta có đầy đủ file example như sau:

Các bạn có thể tham khảo thêm tại:

http://simplehtmldom.sourceforge.net/

http://phpcrawl.cuab.de/

You may also like...

Leave a Reply

Your email address will not be published. Required fields are marked *

WordPress database error: [Column 'referer' cannot be null]
INSERT INTO `wp_power_stats_visits` (`date`, `time`, `ip`, `country`, `device`, `referer`, `browser`, `browser_version`, `is_search_engine`, `user_agent`, `is_bot`, `os`) VALUES ('2017-08-21', '2017-08-21 13:45:45', '54.162.111.247', 'US', 'desktop', NULL, NULL, '', '', 'CCBot/2.0 (http://commoncrawl.org/faq/)', '', '')