랩실에 서버들 하드/데이터 어떻게 하는게 효율적일까요?

페이지 정보

211 조회
4 댓글
0 추천

본문

랩실에서 굉장히 주먹구구식으로 세팅해서 연구해왔는데, 이제 사람이 조금씩 늘어서 더 많아지기 전에 좀더 효율적인 방법을 생각해야 할 것 같습니다.

그 동안 교수님이 연구비 되는 대로 웍스 혹은 랙서버 등을 모아오셔서... 저희는 필요한 서버에 각자 자기 홈디렉토리 파서 작업하는 스타일로 해왔고, 만약 하드가 모자란다 하면 새로 하드 달아서 거기로 누군가가 홈디렉토리를 옮겨 작업하는 방식을 해왔습니다.


근데 이제 막 노드도 많아지고, 동일 작업을 쪼개서 나눠서 돌리고 이럴 때 너무 귀찮고, 지금 새로 들어오고 있는 친구들은 이런 작업을 능숙하게 하지는 못하는 것 같고, 데이터양은 계속 늘고 그 때마다 하드 달고 데이터 옮겨주거나 자기 홈디렉토리에 마운트 해주는 주먹구구 방식이 한계인 것 같습니다.


그래서 생각해봤던게 따로 데이터 서버를 두고, 각각 서버에서 작업 돌릴 때는 필요한 코드나 데이터를 데이터 서버에서 땡겨오고 저장하는 방식을 생각했는데, 이게 정말 더 효율적인 방법은 맞을까요?ㅎㅎㅎ

(클러스터로 만드는 방법은 우선 고려하고 있지 않습니다.. CPU 웍만 하면 어떻게든 묶어서 돌리면 될것 같은데, GPU 는 너무 파편화되어 있어서.. 같이 묶는건 우선 너무 힘들 것같아요)


우선 짧은 지식으로 생각해본건,


지금 랩실에 놀고 있는(백업용으로 샀지만 세팅못한.....) 8베이 시놀로지가 있어서 거기에 레이드로 묶인 큰 데이터 공간을 만들어서 각각 서버에서 시놀로지에서 NFS 나 SMB로 마운트해서 작업하게 하면 어떨까 생각했습니다. 그러면 어쨌든 전체적으로 공간 관리가 하나에서 되는 거고, 필요하다면 데이터 서버만 확장하면 되니까.. 라고 생각했는데 어떨까요?


네트워크는 내부적으로는 서버들끼리는 현재 2.5gbps 혹은 10gbps로 연결 되어 있고, 시놀로지는 4개의 rj45가 있긴한데 1gbps라 10gbps 랜카드를 설치해야할 것 같습니다. (그런데 여러개 포트를 스위칭 허브에 다 물려두면, hostname 만으로 서버에서 시놀로지를 마운트하면 알아서 트래픽(?) 분산(?)이 되는 걸까요? 지금 스위치는 unmanaged 스위치라 LACP가 되는 걸로 바꿔야할 것 같긴합니다.)


업체 끼고 정비하기엔 너무 소규모 같고, 그렇다고 직접 랩실 내에서 하자니 뭐가 진짜 효율적인 방법인지 몰라 계속 방치해왔는데 이젠 뭔가 정리해야할 것 같아 질문 남겨봅니다..

댓글 4 / 1 페이지

자근자근님의 댓글

사용자 계정도 같이 고려하셔야 합니다. 디스크만 서로 다른 서버에서 마운트할 경우 권한이 꼬여서 제대로 사용하기 어려울겁니다.
NFS 가 있듯이 계정 공유에 NIS 라고 있는데요, 경험상 설정하기 어렵고 불안정합니다. LDAP 이 한번 설정해두면 문제없이 잘 굴러가는데, 둘다 초기 설정이 생각보다 복잡한 단점이 있습니다.
시놀로지가 있으면 아마 LDAP 서버, 클라이언트를 둘 다 지원할겁니다. 한대를 계정 관리 메인으로 두고, 다른 시놀로지 및 서버들의 사용자 계정을 LDAP 에서 가져오게 구성해보세요.

전 시놀로지는 없고 서버 하나를 LDAP 서버로 두고 대용량 스토리지 서버가 있어서 그 서버에 일괄 홈폴더를 만든 뒤 각자 다른 서버에서 모두 네트워크 마운트 걸어뒀는데 몇년째 큰 문제 없이 잘 사용 중입니다.
사용자수가 많진 않아서 LACP 같은거 안해도 큰 문젠 없더라구요

마리오네티님의 댓글의 댓글

맞아요... 막 이 서버 저 서버에서 마운트해서 간단하게 해봤을때는 권한문제가 있었어요..
LDAP 한번 확인해보고 세팅방법 찾아보겠습니다. 어렵지않으면 한번 적용해봐야겠네요 . 감사합니다..

Primary님의 댓글

단일 작업에 요구되는 스토리지 속도는 어느 정도인가요? 또 몇 명이 동시에 작업을 하게 되나요? 딥러닝 학습 데이터가 크거나 하면 아예 스토리지 서버를 새로 짜야 할 것 같은데요.

마리오네티님의 댓글의 댓글

음 그 부분을 먼저 고려해봐야겠게요.. 따져보면 들어가는 품에 비해 생각보다 효율적이지 않을수도 있다는 생각도 조금 드네요ㅎ 감사합니다!
전체 2,163 / 1 페이지
전체 검색