알림
|

클리앙 내글 백업 저도 한번 도전해봐요..

페이지 정보

작성자 무명이 172.♡.42.153
작성일 2024.03.30 07:39
321 조회
4 댓글
3 추천
글쓰기 검색

본문

https://github.com/best-daniel/ang_save 


클리앙 백업, 개인적으로 공부 하는목적으로 만들어 봤어요.  (브라우저 자동화에 관심있는 초보가....)

파이썬 + Selenium 이용해서 해봤어요

목표는 내 글 보관. 저는 글이 별로 없어서 필요가 없는데, 어느분 백개 넘어가는거 수작업 보고 간단히 만들어 봤어요.


1. 내 게시물 URL 수집


url_collect.py --file=backup.txt 

- backup.txt 에 URL을 보관 합니다.


https://www.clien.net/service/board/park/00000000?po=0&sk=id&sv=user_id&groupCd=community&pt=0 

이런식으로 저장되는데 다른분들 크롤링 사용 하셔도 됩니다. (위에 어느분이 만드신것이 있어서 url만 가져오게 해봤어요.)


시간이 없어서 그냥 작동되는것만 확인한거라.. 관심 있으시면 같이 해도 되요.

(제가 웹쪽은 기본 지식만있어서 css, xpath 이런거 좀더 지능적으로 하기에는 시간도 없고 해서 일단 작동되게만 해봤어요..)


2. 1) 에서 수집한 내 글을 파일로 저장 

이건 다른분 크롤링 쓰셔도 되요. 단순하게 저장만 하기 때문에 이미지 경로등은 보정 안하는데 나중에 한번 해볼려구요.

나중에 시간되면(주말이후에나) 좀더 해볼려고 일단 저장만 하게..


download_url.py --url_file=backup.txt --save=.\save


저장 디렉토리에 글ID 로 저장해요.


댓글 4 / 1 페이지

빅버그님의 댓글

작성자 빅버그 (162.♡.119.35)
작성일 03.30 07:41
이게 뭔 X고생인지 모르겠네요..감사합니다

이제뭐하지님의 댓글

작성자 no_profile 이제뭐하지 (162.♡.138.206)
작성일 03.30 18:22
제가 웹프로그래밍쪽은 잼병이라 그런데, 공부차 위에 올려주신 링크를 누르니
https://www.clien.net/service/board/park00000000?po=0&sk=id&sv=user_id&groupCd=community&pt=0
페이지를 찾을 수 없다고 뜨네요?

무명이님의 댓글의 댓글

대댓글 작성자 무명이 (172.♡.222.151)
작성일 03.30 18:47
@이제뭐하지님에게 답글 저링크는 예제라 실행하면 저런식으로 저장 한다는 거라서요.  진짜글의 ID랑 사용자 이름 지운거예요. 소스는 제일위의 github에있어요

이제뭐하지님의 댓글의 댓글

대댓글 작성자 no_profile 이제뭐하지 (172.♡.63.62)
작성일 03.30 20:11
@무명이님에게 답글 아하… 감사합니다
글쓰기 검색
전체 검색