외산 의존 슈퍼컴 국산화 '물꼬'…가속기 칩 자체 개발 성공
페이지 정보
본문
* 공식 보도자료 링크
[2024-67호] ETRI, 국내 최초 슈퍼컴퓨터용 가속기 칩 개발
https://www.etri.re.kr/kor/bbs/view.etri?b_board_id=ETRI06&b_idx=19392
* 아래 동아사이언스 기사 내용 일부
https://www.dongascience.com/news.php?idx=68201
슈퍼컴퓨터 핵심기술인 가속기가 국내 최초로 개발됐다. 기술이 상용화되면 한국이 세계 5번째 슈퍼컴 제조국에 들 수 있을 것으로 기대된다.
한국전자통신연구원(ETRI)은 'K-AB21'이라는 시스템온칩(SoC) 형태의 슈퍼컴 가속기 개발에 성공했다고 30일 밝혔다. 가속기는 슈퍼컴의 계산을 빠르게 하는 부품이다.
현재 슈퍼컴을 자체 생산할 수 있는 국가는 미국, 중국, 일본, 프랑스로 4개국에 불과하다. 최근 슈퍼컴에 쓰이는 가속기는 정밀도가 낮은 인공지능(AI)용 연산에 초점을 맞추고 있다. AI 추론용 가속기인 신경망처리장치(NPU)는 전통적인 슈퍼컴 활용처인 정확한 과학 계산과 엔지니어링 시뮬레이션에는 적합하지 않다.
연구팀은 전통적인 고정밀도 슈퍼컴퓨터를 위해 슈퍼컴 가속기, 소프트웨어, 계산노드를 자체 개발했다. 가속기 칩 안에는 약 100억 개의 트랜지스터가 들어 있어 국내 최대 규모다.
연구팀이 개발한 슈퍼컴용 가속기는 8테라플롭스(TFLOPS, 1TFLOPS는 1초에 1조 번 연산하는 속도) 수준의 성능으로 오는 11월 미국 애틀란타에서 개최되는 세계 최대 슈퍼컴퓨팅 기술 전시회인 '슈퍼컴퓨팅24(SuperComputing24)'에 전시된다.
[이후 내용 생략]
mtrz님의 댓글의 댓글
터미네이터 외에는 딱히 쓰던 컴이 아닌게 아닌가 싶은 그런 느낌이....
어차피 저 장비로는 원격으로 붙은 것일 테니 말입니다.
junja91님의 댓글의 댓글
조알님의 댓글의 댓글
조알님의 댓글의 댓글
제 직장의 공용 HPC 시스템 (대략 100노드 2만 CPU 코어 급) 은 Rocky Linux 기반으로 구성되어 있고요,
또 제가 사용하는 다른 대규모 HPC 시스템인 Kestrel (대략 2500노드 26만 CPU 코어 + H100 528개) 은 RHEL 기반입니다.
작은규모 클러스터에서는 편한대로 아무거나 써도 되는데, 대규모로 가면 RHEL 이나 RHEL 클론을 많이 쓰는거 같아요.
6K2KNI님의 댓글
국내에서는 첨단 공정 IC를 발주 받아주는 회사가 없기 때문입니다. 할 수 없이 tsmc로 발길을 돌리죠.
거기선 칩 설계도를 가져가면 웨이퍼 한장 수량이라도 디자인 하우스를 연결해주고 만들어주니까요.
조알님의 댓글
NVIDIA H100 의 FP64 연산성능이 현재 34TFLOPS, FP64 TensorCore 는 무려 67TFLOPS 입니다..
수퍼컴퓨터에서 NVIDIA H100 으로 대동단결이 된 상황에, 새 칩에서 8TFLOPS 짜리 FP64 연산기 가지고,
게다가 3U 섀시에 최대 두개까지밖에 장착이 안된다고 하는데, 그걸로 어떤 영향을 줄 수 있을까 궁금하네요.
킁킁님의 댓글
HTTR님의 댓글
오늘을산다님의 댓글
웃자오늘도님의 댓글
과제 마무리할때가 되서,
결과보고서에 넣을 기사가 필요했나보네요.
디카페인중독님의 댓글
요즘 놑북에 내장된 4070이 몇 배 더 빠르겠네요...
조알님의 댓글의 댓글
데스크탑용 4070 의 FP64 성능은 0.45 TFLOPS 입니다. 노트북은 아마 좀더 느리겠죠.
FP64 는 배정도 정밀도 연산이라서.. 과학계산용으로 사용되고 일반적으로 게임이나 그래픽용으론 사용하지 않습니다.
참고로 데스크탑용 4090 도 FP64 성능은 1.2 TFLOPS 입니다.
컨수머용 그래픽카드로는 과학계산용 GPU 를 따라갈 수 없습니다. FP64 연산하려고 만든 물건이 아니라서요.
그래서 H100 같은 과학계산용 GPU 를 한개당 3만불 가까이에 (4천만원 넘는 가격) 팔아도 불티나게 팔리고 있습니다 ㅠㅠ
아름다운별님의 댓글
우분투 로고 + Snap Daemon 실행 로그 + 아마존 제휴링크 ...