목록Python/Theory (7)
나홀로 데이터 분석가의 1인 연구실

0-1. HTML이란? 웹 크롤링을 하기 앞서 기본적인 개념을 이해할 필요가 있습니다. 에서 웹 페이지는 우리가 평소 웹 브라우저에 접속하면 보이는 화면입니다. 이러한 페이지를 구성하는 것은 의 우측인 HTML 구조로 되어있습니다. 웹 크롤링은 이 HTML 구조에서 정보를 뽑아오는 것입니다. 0-2. HTML의 계층구조 HTML 구조는 기본적으로 계층구조로 되어 있습니다. 계층구조는 간단히 생각하면 컴퓨터의 폴더 구조와 비슷하다고 보시면 됩니다. ex. [바탕화면] > [대학원] 폴더 > [1학기] 폴더 > [3월] 폴더 > [레포트.txt] 웹 크롤링은 이러한 폴더 안에 있는 파일을 검색을 통해 찾아오는 것입니다. HTML의 계층구조에 대해 감을 잡으셨다면, 이제 가상으로 크롤링을 해볼 것입니다. 만약..
Python/Theory
2022. 12. 26. 14:19