홈택스 스크래핑하는 분들은 국세청에 등록하는걸까요?
알림
|
페이지 정보
작성일
2024.06.27 09:39
본문
국세청 전자세금계산서 내역 조회를 개발중인 개발자입니다.
홈택스 AJAX를 통해 로그인하는 과정에서 로그인 승인이 나지 않는 오류가 있어서
국세청 에 질문드려 답을 받았습니다.
1. 홈택스 대상 개발자가 참고할 수 있을만한 홈택스의 스크래핑, 전자신고 개발관련 약관이나 가이드라인을 볼 수 있는 방법이 있는지?
-> 따로 약관이나 가이드라인은 없음
2. 일반 스크래핑 업체들이 홈택스 서버에 개발 프로그램으로 로그인하는 방법이 있는지? 부여받은 코드나 프로그램 이름을 제시하는 방법인지?
->세목 관련 전자신고 서비스를 테스트 하기 위한 환경을 제공하고 있음. (저는 신고가 아니라 데이터 조회입니다..)
국세청도 일반 개발쪽이 어떻게 진행되는지까지는 알 수가 없음.
자료실 게시글 확인하여 방화벽 허용 요청 주면
홈페이지와 유사한 사이트로 테스트가 가능함.
위 답변들로 유추해볼때
기존 API나 스크래핑 업체들은 국세청쪽에 신청(같은 작업)으로 방화벽 허용을 하는게 아닐까 하는데
다른 업체들은 어떻게 하시는지 궁금합니다.
상식적으로 생각해봤을때도 후에 실제로 스크래핑 서비스를 운영하려면 이런식으로 해야 옳지 않나 생각되네요.
댓글 8
/ 1 페이지
gudtkdml님의 댓글의 댓글
@미트로프님에게 답글
그렇군요
크롬 개발자 도구를 이용하여 분석하면서 web request를 보내는 식으로 코딩했는데
id, pw 로 로그인까지는 성공했지만 뭔가 홈택스 서버 내부에서 승인을 안해주는건지 방식이 잘못된건지
세션이나 쿠키들이 제대로 들어갔다는것도 확인했지만
다른 페이지로 가면 사용자 정보는 반환되고 로그인이 안되었다고 나오네요..
미트로프 님 말씀 대로라면
홈택스 서버 보안상 문제라기보다는
제 코딩이나 방식을 검토해볼 필요가 있겠군요
감사합니다.
크롬 개발자 도구를 이용하여 분석하면서 web request를 보내는 식으로 코딩했는데
id, pw 로 로그인까지는 성공했지만 뭔가 홈택스 서버 내부에서 승인을 안해주는건지 방식이 잘못된건지
세션이나 쿠키들이 제대로 들어갔다는것도 확인했지만
다른 페이지로 가면 사용자 정보는 반환되고 로그인이 안되었다고 나오네요..
미트로프 님 말씀 대로라면
홈택스 서버 보안상 문제라기보다는
제 코딩이나 방식을 검토해볼 필요가 있겠군요
감사합니다.
미트로프님의 댓글의 댓글
@gudtkdml님에게 답글
전자세금계산서는 ID, PW 로 스크래핑이 되는지는 모르겠어요.
대부분 세금계산서용 공동인증서를 반드시 필요로 했었거든요. 그래서 갱신될때마다 교체해야 한다고 했구요.
그리고 부가세신고기간이나, 연말정산 등 방문자수가 급증하는 시기에는 스크래핑을 일시적으로 막기도 하는것 같습니다.
대부분 세금계산서용 공동인증서를 반드시 필요로 했었거든요. 그래서 갱신될때마다 교체해야 한다고 했구요.
그리고 부가세신고기간이나, 연말정산 등 방문자수가 급증하는 시기에는 스크래핑을 일시적으로 막기도 하는것 같습니다.
gudtkdml님의 댓글의 댓글
@미트로프님에게 답글
지금 기술력으로는 공동인증서쪽이 부족해서
일단은 id, pw로 로그인하기만 하면 화면이 출력되는 사업자신용카드 매입매출 내역을 테스트삼아서 하고 있습니다.
일단은 id, pw로 로그인하기만 하면 화면이 출력되는 사업자신용카드 매입매출 내역을 테스트삼아서 하고 있습니다.
곰팅이☆님의 댓글
전자세금계산서관련 API로 땡겨가는건 원칙적으로 국세청 전자세금계산서 시스템 표준인증 을 받은 사업자만 접근 할 수 있는걸로 압니다.
홈텍스 내 전자세금계산서 API 연동 관련 페이지와 테스트 인증용 페이지가 존재하는걸로 압니다
(어딘지 찾아놨었는데 방금 찾아보니 안보이네요 -_-;;;;;;)
홈텍스 내 전자세금계산서 API 연동 관련 페이지와 테스트 인증용 페이지가 존재하는걸로 압니다
(어딘지 찾아놨었는데 방금 찾아보니 안보이네요 -_-;;;;;;)
자근자근님의 댓글
최근에 만들어서 쓰고 있는데, 다른 곳도 그냥 스크래핑으로 만드는 것 같았습니다.
id/pw 로 로그인해봤자 다시 인증서가 필요한 경우가 많아서,,, 처음부터 인증서 로그인으로 개발하는게 편합니다 ㅋㅋㅋ
제가 만들땐 id/pw 로그인도 별 문제가 없었으므로, 구현에 뭔가 빠트리신게 있을 것 같습니다
id/pw 로 로그인해봤자 다시 인증서가 필요한 경우가 많아서,,, 처음부터 인증서 로그인으로 개발하는게 편합니다 ㅋㅋㅋ
제가 만들땐 id/pw 로그인도 별 문제가 없었으므로, 구현에 뭔가 빠트리신게 있을 것 같습니다
gudtkdml님의 댓글의 댓글
@자근자근님에게 답글
다른곳들도 특정 등록이나 그런게 아니라 일반적으로 요청 보내는 식으로 스크래핑을 한다는 말씀이신가요?
그렇다면 일단 홈택스 서버에 로그인 요청을 보내는 제 구현을 검토해봐야 겠네요!
그렇다면 일단 홈택스 서버에 로그인 요청을 보내는 제 구현을 검토해봐야 겠네요!
아이폰점보님의 댓글
기억이 가물가물하지만 크롬 개발자 도구에서 요청을 잡아서 curl command로 뽑아낼 수 있을 겁니다. 터미널에서 이 요청 기준으로 값을 바꿔가며 테스트하거나, Postman으로 읽어들여서 GUI로 요청 수정하면서 테스트 하시는게 편하실 거에요.
미트로프님의 댓글
사람이 '법인용 공인인증서 로그인 해서 세금계산서 조회' 하는 과정을 자동화 하고 조회된 내용을 스크래핑해서 저장하는 형식으로 제공 할 겁니다.
자동화한다는게 그 페이지에서 개발자도구 등으로 필요한 필드명과 값을 찾아서 일일이 만드는 과정이 필요하기도 하죠.
그래서 스크래핑시 필요한 필드명이 달라지면 그때그때 수정하고 반영 해줘야 동작하기도 하고요.