내맘대로 코딩32 내맘대로 크롤링(1): HTML구조와 태그 우선은 내가 크롤링 하는 사이트를 위주로 정리해볼 것이다 가장 기초라고 할 수 있는 HTML 코드를 내가 정리한 부분으로 살펴보자면 내용 내맘대로코딩 이게 기본 구조라고 볼 수 있다. 아래는 예시로 살포시 써본 것. 자주쓰는 태그 종류는 구역나누기 링크(대체로 ) 제목 문단 , 목록 이렇게 있는데, 내가 크롤링했던 사이트들은 table 하위에 tbody, 그리고 각 tr들로 구성되어 있었다. 설명하기는 어렵지만 어쟀든 table > tbody > tr 이걸 구글링좀 해보니까 는 표의 데이터를 담는 것이라고 하고, 그 안에 은 row 행을 만든다. 고 되어있음. 사실 내가 원하는 페이지들은 대체로 표가 많더라. 결국 크롤링을 하려면 HTML구조를 아예 모르면 어렵다고 느꼈음. 정리하자면 table row의.. 2023. 7. 9. 내맘대로 크롤링 (0): 크롤링을 하게 된 이유 요즘들어 크롤링에 빠졌다. 한참전부터 내가 원하는 데이터를 갖고 오려면 꼭! 크롤링이 필수다 싶어서 크롤링을 해야지 ~ 했는데 이번 우연한 계기로 크롤링을 약간 강제로(?) 하게 되었고 덕분에 이것저것 찾아보면서 크롤링을 하게 되었다. 예전부터 크롤링을 하려고 강의를 참 많이 들었었는데 이게 막상 적용이 잘 안되고 내가 이해를 못하는건지.. 이번에는 '스타트코딩'님의 강의를 들었고 완벽~히 이해하고 이제 내가 하고 싶은 사이트에 크롤링을 할 수 있게 되었다. 다시한번 갓타트.. 눈부셔 여튼 그래서 여기다가는 내가 정리했던 내용들을 입력해두려고 한다. 굿노트에다가 필요한 내용들을 정리해놨지만, 내가 찾아보면서 정리한 내용들을 여기서 정리해서 복습? 한다고 생각해야지 ㅎㅎ 아무튼 말이 길었고.. (1)번부터.. 2023. 7. 9. 이전 1 ··· 3 4 5 6 다음