[구글 스프레드시트] OTT별 순위 가져오기 (네이버 땡큐~ 쏘 머치)

2023. 12. 15. 19:02자격증(다다익선)/웹개발(HTML,Javascript)

728x90

[구글 스프레드시트] OTT별 순위 가져오기 (네이버 땡큐~ 쏘 머치)


영화진흥회 API로는 부족해!!!

 

https://chanytv.tistory.com/188

 

[API] 구글 스프레드시트 영화진흥회 DB 가져오기

[API] 구글 스프레드시트 영화진흥회 DB 가져오기 어? 네이버 영화 안되구나? 네이버는 개발자들에게 다양한 정보를 제공한다. 그중에서 많이 사용했던 게 영화 search였다. 그런데... 간만에 들어가

chanytv.tistory.com

이 게시글을 작성하기 전 영화진흥회 API를 활용해 필요했던 정보 가져올려 했다.

하지만 내가 원하는 정보를 얻기엔 조금 아쉬웠다.

 

그래서 그냥 네이버를 크롤링했다.


넷플릭스 오리지널 한국영화만 엑셀화해서 정리하려던게...ㅋㅋ

 

시작은 그냥 제목에서처럼 넷플릭스 오리지널 한국영화 리스트를 엑셀화 하려 했다.

근데 어쩌다 이 지경까지 된건지...ㅋㅋ 아무튼 막상 만들다 보니, 응용할 수 있는 부분이 많을 것 같아서 조금 힘을 줘봤다.

 

일단 완성된 ver.1이다.

 

크롤링은 네이버를 통해서 수집을 했다. 네이버에 '넷플릭스 추천' 이런식으로 검색을 해보면 아래와 같은 검색내용을 확인할 수 있다.

다른 OTT도 비슷한 구조로 검색내용을 확인 할 수 있다. 비슷한 구조??

그렇다. 비슷한 걸 넘어 똑같은 구조이기 때문에 넷플을 크롤링하게 되면 티빙, 웨이브, 왓차도 크롤링이 가능하단 거다.

ver.1 기능을 요약하면 아래와 같다.

  • 넷플릭스 / 티빙 / 웨이브 / 왓차의 지금 많이 찾는 1~12위까지 크롤링
  • 각 작품별 썸네일 / 작품명 / 제작국가 / 제작연도 / 해시태그 / 해당작품 네이버 검색결과를 크롤링
  • 썸네일은 src를 이미지화해서 출력
  • 제작국가 및 제작연도, 해시태그를 제공하지 않을 경우 공란으로 출력
  • 검색조건 전체 / 국가 / 장르 추가
  • 스크립트 실행 날짜와 시간 출력
  • 검색 및 PDF저장 버튼 생성
  • 검색결과 PDF로 구글드라이브에 저장 가능

ver.2에는 뭘 추가해야 할까?

 

사실 크롤링의 묘미는 정보를 수집했다는 것에서 멈추면 안 된다. 수집한 내용을 토대로 또 다른 정보를 생성하는 것이 묘미이지 않겠는가. 그래서 만들면서 생각했던 몇 가지를 차후에 추가할까 한다.

  • 주간 순위 / 신작 / 오리지널도 검색조건에서 선택할 수 있게끔 추가
  • OTT별 동일 작품 순위 그래프화
  • 매주 자동으로 크롤링

일단은 뭐 이 정도만 추가해볼까 한다. 물론 된다는 보장은 없다. 구글 앱 스크립트가 어디까지 되는지를 나도 잘 모르다 보니 일단 해보고 되면은 만들꺼다.

728x90

스크립트 구동 영상

 

검색조건 : 영화 | 한국 | 스릴러

검색일시 : 2023 / 12 / 15

728x90