2013년 올라온 웹페이지 38%가 10년 후 사라져
알림
|
페이지 정보
작성일
2024.05.19 17:30
본문
[원문]
When Online Content Disappears : 38% of webpages that existed in 2013 are no longer accessible a decade later
https://www.pewresearch.org/data-labs/2024/05/17/when-online-content-disappears/
[아래 내용 일부 GPT-4o 번역]
인터넷은 수백억 개 웹페이지를 포함한 현대 사회의 상상할 수 없을 만큼 방대한 저장소입니다.
전 세계 사람들이 책, 이미지, 뉴스 기사 등 자료에 접근하기 위해 웹에 의존하지만, 콘텐츠는 때때로 시야에서 사라지기도 합니다. 이번 새 Pew Research Center 분석은 온라인 콘텐츠가 실제로 얼마나 덧없는지를 보여줍니다.
- 2013년부터 2023년 사이에 존재했던 웹페이지 중 4분의 1은 2023년 10월 기준으로 접근할 수 없게 되었습니다. 대부분 아직 운영 중인 웹사이트에서 특정 페이지가 삭제되었기 때문입니다.
- 오래된 콘텐츠라면 이런 현상이 더욱 두드러집니다. 2013년에 있었던 웹페이지 중 38%가 현재 접근할 수 없는 반면, 2023년에 생성된 페이지 중에서는 8%만이 접근 불가능합니다.
이런 디지털 붕괴 (digital decay)는 여러 온라인 공간에서 발생합니다. 저희가 2023년 봄 기준으로 정부와 뉴스 웹사이트, 위키피디아 페이지 참고 문헌(References) 부분에 나타나는 링크를 조사했습니다. 분석 결과,
- 뉴스 웹페이지 중 23%와 정부 사이트 중 21%가 최소 1개 이상 깨진 링크를 포함하고 있습니다. 사이트 트래픽이 많은 뉴스 사이트와 적은 뉴스 사이트 모두 깨진 링크를 제공할 가능성이 거의 같았습니다. 특히 시(city) 단위 지역 기관 페이지는 깨진 링크가 있을 가능성이 높았습니다.
- 위키피디아 페이지 중 54%는 참조 문헌 부분에 이제 없는 페이지로 연결하는 링크를 하나 이상 포함하고 있었습니다.
소셜 미디어에서 어떻게 진행되는지 알아보기 위해, 2023년 봄에 소셜 미디어 플랫폼 X(당시 트위터)에서 실시간 트윗 표본을 수집하고 3개월 동안 추적했습니다. 그 결과, 아래와 같은 사실을 찾았습니다.
- 게시된 지 몇 달 만에 거의 5분의 1에 해당하는 트윗이 사이트에서 공개적으로 보이지 않습니다. 이 중 60%는 트윗을 올린 계정이 비공개로 전환되었거나, 정지되었거나, 완전히 삭제되었습니다. 나머지 40%는 계정 소유자가 개별 트윗을 삭제했지만, 계정 자체는 여전히 존재했습니다.
- 특정 유형 트윗은 다른 글보다 더 자주 사라지는 경향이 있습니다. 튀르키예어 또는 아랍어로 작성된 트윗 40% 이상이 게시된 지 3개월 이내에 사이트에서 보이지 않게 됐습니다. 또한, 기본 프로필 설정을 사용한 계정 트윗은 특히 공개적으로 사라질 가능성이 높았습니다.
[이후 내용 생략 ……]
Java님의 댓글