2013년 올라온 웹페이지 38%가 10년 후 사라져

페이지 정보

분류 IT
2,631 조회
3 댓글
2 추천

본문

[원문]

When Online Content Disappears : 38% of webpages that existed in 2013 are no longer accessible a decade later

https://www.pewresearch.org/data-labs/2024/05/17/when-online-content-disappears/


[아래 내용 일부 GPT-4o 번역]

인터넷은 수백억 개 웹페이지를 포함한 현대 사회의 상상할 수 없을 만큼 방대한 저장소입니다.

전 세계 사람들이 책, 이미지, 뉴스 기사 등 자료에 접근하기 위해 웹에 의존하지만, 콘텐츠는 때때로 시야에서 사라지기도 합니다. 이번 새 Pew Research Center 분석은 온라인 콘텐츠가 실제로 얼마나 덧없는지를 보여줍니다.

  • 2013년부터 2023년 사이에 존재했던 웹페이지 중 4분의 1은 2023년 10월 기준으로 접근할 수 없게 되었습니다. 대부분 아직 운영 중인 웹사이트에서 특정 페이지가 삭제되었기 때문입니다.
  • 오래된 콘텐츠라면 이런 현상이 더욱 두드러집니다. 2013년에 있었던 웹페이지 중 38%가 현재 접근할 수 없는 반면, 2023년에 생성된 페이지 중에서는 8%만이 접근 불가능합니다.
그래프 이미지입니다.

이런 디지털 붕괴 (digital decay)는 여러 온라인 공간에서 발생합니다. 저희가 2023년 봄 기준으로 정부와 뉴스 웹사이트, 위키피디아 페이지 참고 문헌(References) 부분에 나타나는 링크를 조사했습니다. 분석 결과,

  • 뉴스 웹페이지 중 23%와 정부 사이트 중 21%가 최소 1개 이상 깨진 링크를 포함하고 있습니다. 사이트 트래픽이 많은 뉴스 사이트와 적은 뉴스 사이트 모두 깨진 링크를 제공할 가능성이 거의 같았습니다. 특히 시(city) 단위 지역 기관 페이지는 깨진 링크가 있을 가능성이 높았습니다.
  • 위키피디아 페이지 중 54%는 참조 문헌 부분에 이제 없는 페이지로 연결하는 링크를 하나 이상 포함하고 있었습니다.

소셜 미디어에서 어떻게 진행되는지 알아보기 위해, 2023년 봄에 소셜 미디어 플랫폼 X(당시 트위터)에서 실시간 트윗 표본을 수집하고 3개월 동안 추적했습니다. 그 결과, 아래와 같은 사실을 찾았습니다.

  • 게시된 지 몇 달 만에 거의 5분의 1에 해당하는 트윗이 사이트에서 공개적으로 보이지 않습니다. 이 중 60%는 트윗을 올린 계정이 비공개로 전환되었거나, 정지되었거나, 완전히 삭제되었습니다. 나머지 40%는 계정 소유자가 개별 트윗을 삭제했지만, 계정 자체는 여전히 존재했습니다.
  • 특정 유형 트윗은 다른 글보다 더 자주 사라지는 경향이 있습니다. 튀르키예어 또는 아랍어로 작성된 트윗 40% 이상이 게시된 지 3개월 이내에 사이트에서 보이지 않게 됐습니다. 또한, 기본 프로필 설정을 사용한 계정 트윗은 특히 공개적으로 사라질 가능성이 높았습니다.

[이후 내용 생략 ……]

댓글 3 / 1 페이지

아름다운별님의 댓글의 댓글

@Atom님에게 답글 여기 회원님들(저 포함) 예전 사이트 글 싹 밀고 떠나는 사례 같은 것이 포함되지 않았을까 싶어요.
전체 1,538 / 1 페이지
전체 검색