홈택스 스크래핑 개발 근황
페이지 정보
본문
다른 분들이 주신 정보들로
https://hometax.go.kr/pubcLogin.do?domain=hometax.go.kr&mainSys=Y
해당 링크로 인코딩 된 ID, PW 값들을 보내 로그인된 세션값과 그 외 반환 값들을 받는것을 개발중이었습니다.
c# httpwebrequest로는 아무리 해도 안되다가 python requests로 해도 <errmsg>LOGIN</errmsg> 이 반환되어 실패..
(로그인 성공했으면 다른 링크 호출시 "NTS_REQUEST_SYSTEM_CODE" 쿠키가 반환되어야 함.)
그 후 java httpsurlconnection 을 사용하여
위 링크로 똑같은 헤더, 컨텐츠를 POST하니
제대로 로그인 완료처리 된 결과가 나와서 로그인 성공했습니다.
그 후 사업용신용카드 매입매출 내역 출력 성공!
그동안 좋은 정보 주신 분들
제가 너무 귀찮게 해드렸는데 죄송하고도 너무 감사합니다!
그동안 c# httpwebrequest, python requests 로 안되다가 java httpsurlconnection 으로 하니
성공한 이유가 알고 싶어 분석중입니다.
그런데 java httpsurlconnection 으로 한번 홈택스 서버에 요청보내고 나니
제 방화벽이나 어떤 설정이 혈이 뚫린것인지
안되던 c# httpwebrequest, python requests 로 다시 해봐도 로그인이 잘 됩니다…뭐지..
안되던 이유를 연구하려고 했는데 당황스럽네요..
java httpsurlconnection 을 사용하고 난 후 tls/ssl 설정이 달라졌거나 아웃바운드 설정이 달라진걸까요? 신기하네요.