• 회원가입
  • 로그인
  • 구글아이디로 로그인

[PHP-서기] PHP 51 - 웹사이트크롤링 (= 사이트파싱) ★★★ (= 타사이트 특정부위 가져오기)

7,754  

Simple HTML DOM

 

소개
jQuery 문법으로 HTML 데이터 제어하는 라이브러리 .

 

다운로드 

https://sourceforge.net/projects/simplehtmldom/files/

 

매뉴얼

https://simplehtmldom.sourceforge.io/manual.htm

 


 

<?php

// PHP정보

//phpinfo();


// 파일정보 가져오기 허용설정

ini_set("allow_url_fopen",1);


// DAUM 사이트 가져오기

include "simple_html_dom.php";

$data = file_get_html("https://daum.net");


// DAUM 사이트 보여주기

//echo $data;



// 특정부분만 가져오기

$a = $data->find("ul.list_txt");

//echo $a; // Array



/*

// 텍스트만 가져오기 (실패)

foreach($a as $b) {

   echo $b->plaintext;

   echo "<br>";

}

*/


// 텍스트만 가져오기 (성공)

foreach($a as $ul) {

    $c = $ul->find("li");

    foreach($c as $li) {

        echo $li->plaintext;

        echo "<br>";

    }

}

 

관련글 (121120) https://sir.kr/pg_tip/12474 

 

Snoopy (스누피)

 

다운로드

https://sourceforge.net/projects/snoopy/

 


 

<?php

include "simple_html_dom.php";

include "Snoopy.class.php";

$snoopy = new Snoopy;

$snoopy->referer = 'https://naver.com'; // 가짜 리퍼러

$snoopy->fetch('https://naver.com'); // 크롤링할 사이트

$data = str_get_html($snoopy->results);

echo $data->plaintext; 

?>

 

※ str_get_html() 함수는 Simple HTML DOM 정의 함수.


 

include "Snoopy.class.php";

$snoopy = new Snoopy;

$url = "https://naver.com";

$snoopy->fetch($url);

$list_result = $snoopy->results;

echo $list_result;

 

서기 님


분류 제목
PHP-서기 PHP 52 - PDF 만들기1. 기본환경 설정
PHP-서기 PHP 51 - 웹사이트크롤링 (= 사이트파싱) ★★★ (= 타사이트 특정부위 가져오기)
PHP-서기 PHP 50 - vscode 이용한 ftp서버상파일 직접 편집/저장
서버 서버 - URL RewriteRule (= 라라이트룰 = URL주소치환 = URL주소변경)
React React - 리액트 무료강의 (재생: 5시간 5분 33초)
PHP-쩡원 PHP 중급 2강 - 쇼핑몰 (회원가입, 로그인, 로그아웃. 기타) 페이지
PHP-쩡원 PHP 중급 1강 - 쇼핑몰 (Root 디렉터리 , index파일, mysql파일 + 회원가입 페이지) 만…
PHP-쩡원 PHP 기초 12강 - 게시판 만들기 - 자주하는 코딩실수 (※ 기초과정 종강)
PHP-쩡원 PHP 기초 11강 - 게시판 만들기 - 코멘트(댓글, 답글) , 게시글검색
PHP-쩡원 PHP 기초 10강 - 게시판 만들기 - 코멘트 (=댓글) , 답댓글 (= 대댓글) 입력, 출력, 입출력
PHP-쩡원 PHP 기초 9강 - 게시판 만들기 (파일수정, 파일삭제, 스마트에디터달기)
PHP-쩡원 PHP 기초 8강 - 게시판 만들기 (조회수증가, 날짜형식변경, 파일업로드, 파일명중복방지)
PHP-쩡원 PHP 기초 7강 - 게시판 만들기 (글수정, 글삭제, 삭제확인, 목록링크)
PHP-쩡원 PHP 기초 6강 - 게시판 만들기 (페이징)
PHP-쩡원 PHP 기초 5강 - 게시판 만들기 (테이블, 필드, 입력폼, 생성, 수정, 삭제, 변경) (alter, u…
PHP-쩡원 PHP 기초 4강 - 회원가입 만들기 (폼입력값 유효성검사) (Form Validation)
PHP-쩡원 PHP 기초 3강 - 회원가입 만들기 (테이블생성, 필드생성, 입력폼생성 / 쿠키, 암호화) (member,…
PHP-쩡원 PHP 기초 2강 - 게시판 만들기 (테이블생성, 필드생성, 입력폼생성) (board, table, fiel…
PHP-쩡원 PHP 기초 1강 - APMSETUP 설치 + PhpMyAdmin 설치
PHP-쩡원 PHP 기초 0강 - PHP 입문 (기본 구문, 연산자, PHP와 HTML 혼용)
10/35
목록
찾아주셔서 감사합니다. Since 2012