SSD(solid state DISK)

153,600core 슈퍼컴퓨터 크기가 100평 크기도 않된다. 란> 의견에 의문점 제기

SSD 광장 2012. 6. 12. 23:06

안녕하세요. 오랜만인것 같습니다.

 

최근 제가 153,600core 슈퍼컴퓨터를 제작하여, 3D업계 페러다임을 바꾸어 보겠다고 2012년 5월4일 SSD IMPACT 세미나 때 발표를 한적이 있습니다.  물론 관련된 투자도 함께 진행을 하고 있습니다.

 

위 내용에 관련하여 국내 슈퍼컴관계자와 중국 슈퍼컴 관계자분들께서 가로, 세로 크기론 불가능 수치이니, 높이를 15층 아파트 규모로 설계를 했느냐? 하더군요.  국내 관계자는 공공기관에 계신분 이였으며, 중국은 중국내 유명대학 관계자분 이셨습니다.

 

구체적 내용은 일반서버 랙 2배정도가 현 LSDTech 슈퍼컴 크기입니다. 1024core 수준입니다. 이 크기 정도에 5120core 슈퍼컴을 제작 하고 있으며, 3.3평형 수준에 30,000core 수준이며, 30평 정도 크기에 153,600core 슈퍼컴 크기다. 공조기를 포함 100평 수준 이다. 라고 발표를 했었습니다. ^^ㅋㅋ 사실이구요,,,,,

 

이번 153,600core 수퍼컴은 기존 디자인과 달리 슬림타입입니다.

보드부터 새롭게 디자인하였으며, 열처리 관계로 아주 직접화된 로드로 구성 하였습니다.

CPU도 기존 활용 제품이 아니며, Network도 10G 이더넷에서 40G 이더넷과 이피니밴드를 검토 중이며 테스트 중 입니다.

 

좀더 구체적인 기술내용은 1차 5120core를 제작 완성후 공개 예정입니다.

5120core 까지는 랙 형태이며, 30,000core이상부터는 돔 형태입니다.

 

돔 5개면 150,000core, 10개면, 300,000core 슈퍼컴이 되는것입니다. 실제 300,000core수준을 100평 규모로 디자인하면 이쁠것입니다.

HW적으론 무리없이 진행을 하고 있으나. SW부분은 다양하게 테스트를 하고 있습니다.

기본 틀이 CLOUD 이니, VM을 활용 해야 할 상황이라, 3가지 VM을 다양하게 테스트를 하고 있습니다.

무상제공인 Hyper V가 기대 됩니다....

 

Linux VM도 검토를 하고 있습니다.

프레임은 단순하게 디자인하고, 실제 활용할 OS나 AP들이 잘운영 될수 있도록 하고 있습니다.

상용VM와 무상VM들을 잘 혼용하여 다양한 일반 업무들을 처리 하고자 합니다.

 

먼저 3D랜더링쪽에 적용 하려 하고 있으며, 이번 슈퍼컴엔 CPU + GPU 혼합형 로드는 지양하고 CPU전용 , GPU전용 로드를 별도로 제작하여

업무 특성에 맞게 분산, 통합 처리 하고자 합니다.

 

돔별도 SSD는 PB단위로 구성 예정이며, 기본 40Gbps (MAX 160Gbps) network TR을 할 계획 입니다.

RMS는 독립형과 미러형, SAN 타입인 혼합형 형태로 구성 예정입니다.

 

돔과 돔끼리의 TR일 경우는 서버 분산 Storage 통합 형태로 TR이 중요하며, Batch성 업무일 경우는 돔 자체 처리후 결과값만 공유 하는 형태로 디자인 할 계획입니다.

 

어떠한 SW도 운영할수 있게 디자인하는것이 매우 어렵습니다. 이유는 시스템구성이 복잡해지면, 질수록 운영 하는 리소스가 매우 복잡하여

보기는 좋으나, 성능은 엉망일수 있기 때문입니다.

 

현재도 슈퍼컴이 500위까지 설정이 되어 있지만, 수익 창출을 위한 시스템 운영은 1위 슈퍼컴인  "K"도 못하고 있습니다.

시스템 전체 디자인과 로드 설계, 그리고 통신설계가 중요합니다. 물론 열처리, 전력비용 줄이는거 기본이구요,

 

프레임과 OS, 시스템SW, 와 응용SW등이 매우 중요하고 운영하는것이 더 중요 합니다.

 

현재는 3D분야와 빅data처리, 유체분석, 구조분석, 매트릭스 정도는 당장 돌리수 있는 SW들입니다.

 

그러나 현업에서 활용 중인 그룹웨어, ERP, CLOUD서비스 등은 쪼그만 수퍼컴에서 돌리면, 됩니다.

대형 슈퍼컴에서 돌리기엔 아까울수 있습니다.^^ㅋㅋ  그리고 SW를 다시 개발 및 수정을 해야 합니다.

 

물론 CLOUD base이니 로드단위나 돔단위 돌려도 문제는 없겠지만요,.,..ㅋㅋ 여하튼 다양한 형태, 종류의 프로그램을 돌리려면, 구조적으로 HW에서 받쳐주어여 합니다.

 

가장 고민스러운 부분이 연결고리 입니다. 구체적 표현은 중요사항이라,,,

기술적인 문제보다 성능과 안전성 답보 입니다.  새롭게 개발하고 디자인 을 해야 하는  고민이 있습니다.

그리고 로드가 많아질수록 관리 포인드 늘어나서 성능 저하 현상이 있거든요,,,, 요거 해결하는게 힘이 들었습니다.

모니터링해주는 툴과 시스템SW가 중요 합니다. 그리고 Network도 항상 처리해야 할 내용을 사전 알고 있어야 합니다.

 

5120core 미니 슈퍼랙이 완성이 되면, 수퍼컴및 영상을 통하여 공개 하겠습니다.

 

이기택드림