Research

과학 목표 및 자료 활용 계획 요약

우리나라가 수행하고자 하는 연구들은 LSST 활용 전 분야인 태양계 소천체 연구부터 우주론까지를 아우르는 것을 확인할 수 있다. LSST 탐사 관측이 10년 이상 진행되는 계획을 고려하면, 앞으로 새로운 세대의 연구자들의 등장과 연구 환경의 변화에 따라서 1) 새로운 LSST 자료를 활용한 연구 주제의 등장과, 2) 미래의 우주 망원경이나 다른 지상 망원경을 직접적으로 협력적으로 이용하는 탐사 관측 주제들이 제시될 수 있을 것으로 예상한다.

지금까지 정리된 과학 목표들이 요구하는 LSST 자료 접근 및 활용 계획들이 가지는 특징들을 정리하면 아래와 같다.

  • 초신성과 같은 transient 및 변광 천체에 대한 level 1 자료에 대한 접근은 태양계 소천체 연구부터 근우주 항성계 연구 및 우주론까지 다양한 분야에서 요구된다.
  • 다수의 연구 주제들이 다양한 종류로 생산되는 level 2 coadded image를 활용하며, 이로부터 산출되는 catalog에 대한 수요가 많을 것임을 알수 있다.
  • 대부분의 국내 연구자들이, 특정 level 2 catalog나 level 1 자료에 근거해서 선택된 천체들에 대해서 image의 일부 자료에 대한 pixel 값을 접근할 필요성을 가지고 있다.

위에서 정리된 공통된 요소들에 근거해 볼 때, level 1 alert 와 같이 공통적으로 분석에 이용하고자 하는 자료들의 경우 효율적으로 조직화된 방식으로 분석을 수행하거나 계산/저장을 같이 이용하는 것이 유용할 수 있다. 또한 국내 연구자들이 빈번히 자주 편하게 이용할 필요성을 느끼는 deep coadded image나 catalog의 경우 그 이용 빈도가 높다면, 국내 계산/저장 자원에 자료를 복사하여 활용할 필요성이 대두될 수 있을 것이다. 나아가서 image의 일부에 대해서 pixel 값을 접근해서 분석해야 하는 경우들을 위해서도, 대용량 image 자료를 저장 및 분석할 수 있는 국내 환경이 필요할 가능성이 존재한다.

GMT, Gemini, KMTNet, ALMA, SKA와의 연계 연구

우리나라 연구자들의 LSST 자료 활용의 중요한 목적 중의 하나는, 다른 관측 기기나 탐사 관측 자료를 같이 활용한 연구의 수행이다.

후속 관측 대상 탐색으로서의 LSST 자료 활용

LSST의 경우, 광시야의 하늘을 광학에서 관측하는 것을 목적으로 하기 때문에, 자세하게 관측할 필요가 있는 흥미로운 소수의 천체를 발견하는 목적으로 자료를 활용할 수 있다. 뒤에 소개될 여러 과학 주제들 중에서 강한 중력 렌즈 현상의 천체나 아주 먼 초기 우주의 천체들을 찾는 연구들이 대표적인 예이다. 이러한 천체들의 후속 관측은, 이미 우리나라가 이용 가능한 Gemini 관측 시설을 이용하여 광학 및 적외선에서 측광 및 분광 관측을 수행하는 형태로 진행할 것을 계획하고 있다. 나아가서 2020년 경에는, 우리나라가 건설에 참여하고 있는 GMT를 이용하여 더 어두운 LSST 천체들에 대한 후속 관측 수요가 클 것으로 예상된다. 또한 광학 및 적외선 뿐만 아니라, 우리나라가 현재 이용 가능한 ALMA와 같은 소수의 천체를 아주 자세하게 분해해서 볼 수 있는 전파 관측 역시 LSST 천체들에 대해서 요구될 것으로 보인다. 참고로 이들 GMT, Gemini, 그리고 ALMA의 경우 모두 남반구에 위치하고 있으므로, 후속 관측 요구들을 충분히 수용할 수 있을 것으로 기대된다.

다른 파장과 형태의 탐사 관측 자료와 통합 분석

LSST로 얻어지는 탐사 관측 자료는 천체들에 대해서 오직 측광 정보만 있으므로, 다수의 천체들에 대해서 더 자세한 정보를 얻기 위해서는, 다른 파장에서의 측광이나 분광과 같은 다른 형태의 자료를 같이 활용할 필요가 있다. 특별히 다수의 천체들에 대해서 다양한 정보를 이용할 필요가 있는 우주론 연구들이 LSST 자료와 다른 파장이나 형태 자료와 결합한 분석을 필요로 하는 경우들이다. 특별히 SKA와 같은 남반구에서 이루어지는 전파 탐사 관측 프로젝트의 경우, LSST 에서 검출될 다수의 은하들에 대해서 중성 수소 정보를 줄 수 있을 것으로 기대된다. 또한 SKA의 경우 LSST와 같이 time-domain 과학이 중요한 주제로서, LSST의 lever 1 alert 정보와 함께 전파에서의 time-domain 과학을 수행할 수 있을 것으로 예상한다.

LSST 자료 해석을 위한 지원 관측

Time-domain 과학 주제와 관련해서, 초신성이나 변광성과 같은 천체들의 이해에, LSST 관측 자료 분석만으로는 충분하지 않은 경우들이 예상된다. LSST가 같은 천체를 관측하는 횟수나 그 일정이, 해당 천체의 시간에 따른 변화를 충분히 파악하기에 적절하지 않은 경우가 다수 있을 것이다. 이 경우에 우리나라 연구자들이 이용 가능한 KMTNet이나 Gemini와 같은 관측 설비를 이용하여 추가 관측을 수행할 수 있을 것으로 기대된다. KMTNet의 경우 LSST에서 발견되는 밝은 천체들에 대해서 이러한 역할이 기대되고, KMTNet으로 관측이 어려운 어두운 천체들의 경우 Gemini를 이용한 추가 time-domain 지원 관측을 고려할 수 있겠다. 또한, 우리 나라가 이용 가능한 관측 자원을 이용한 분광 후속 관측 프로그램을 구성하거나, 특정 LSST 관측 영역을 선정하여 더 깊은 관측 혹은 다른 파장이나 협대역 측광 관측과 같은 프로그램을 고려해 볼 수 있다.

빅데이타 연구

LSST의 자료 규모를 고려했을 때, 초고성능 컴퓨팅 자원을 활용한 빅데이타 연구 방법론의 적용은 필수이다.

미국 NSF의 경우 의회에 제시한 정책 방향인 “10 Big Ideas for Future NSF Investments”에서 “Windows on the Universe: The Era of Multi-messenger Astrophysics”와 “Harnessing Data for 21 st Century Science and Engineering”이라는 개념을 통해서, 천문우주 연구에서의 새로운 대용량 자료 분석 중심의 연구를 강조하고 있으며, LSST는 이러한 연구의 중요한 예이다.

NSF의 지원을 받는 대용량 자료 처리 및 분석 중심의 과학 연구들 역시 초고성능컴퓨팅 환경을 이용하여 중요한 천문우주 연구 성과를 만들어 내고 있다. 대표적으로 중력파 검출에는 XSEDE와 Open Science Grid가 활용된 바가 있고 (https://pegasus.isi.edu/application-showcase/ligo/), XSEDE의경우 또한 대용량 자료의 효율적인 가시화에도 초고성능 컴퓨팅 환경을 제공하고 있다.

미국 DOE는 Scientific Discovery through Advanced Computing을 통해서 천체물리학 및 우주론 연구를 지원하고 있으며, 기존의 계산을 통한 시뮬레이션 중심 연구에서 나아가서, 고성능 컴퓨팅 자원을 DOE의 지원을 받는 관측 프로젝트에서 생산되는 대용량 관측 자료의 처리, 분석, 저장, 공유에도 활용하고 있다. 우주론 연구에 대용량 자료 분석에 중심을 둔 DECam Legacy Survey 관측 자료와 Q Continuum 계산 결과 자료의 저장, 분석, 공유에 초고성능컴퓨팅을 지원하고 있다.

영국의 경우 Science & Technology Facilities Council을 통해서 대학들에 고성능컴퓨팅 환경들을 구성하고 이들 환경들을 연동하여, 입자물리, 천문학, 우주론의 분야에서의 초고성능 컴퓨팅 환경을 활용한 연구를 지원하는 DiRAC 프로젝트를 운영하고 있다. 2009년 시작한 프로젝트가 추가 지원을 받아, 2011년부터 DiRAC II로 연장되어 운영 중이다. DiRAC의 경우 최근 영국 정부가 Engineering and Physical Sciences Research Council을 통해서 시작하는 Peta-5: National Facility for Petascale Data Intensive Computation and Analytics를 통해서 기존의 고전적인 시뮬레이션 중심의 천문학 및 우주론 연구 지원에서 확장하여, 대용량 자료 분석 중심의 연구까지 포괄할 예정이다.

총 약 50PB 규모로 예상되는 국내 연구자들의 접근이 요구되는 LSST 자료의 분석에 대해서, 초고성능 컴퓨팅을 활용하여 통계 및 기계학습 분석법을 적용하여 천문우주 난제에 대한 연구를 수행하며 거대 규모의 자료 분석법을 개발하고자 한다. 도전하고자 하는 난제는 크게 4개 분야로, 1) 태양계 소천체들의 검출 및 그 특성 파악, 2) 우리 은하 및 외부 은하들의 특성에 대한 광범위한 조사, 3)시간에 따라 변화하는 우주 현상들에 대한 검출 및 이해, 4) 암흑 물질과 암흑에너지로 대표되는 그 정체가 밝혀지지 않은 우주 전체 구성 성분의 특성 추정으로 요약 될 수 있으며, 이 모든 분야에서 초고성능 컴퓨팅의 활용이 요구된다.

현재 국내 연구자들의 참여가 확정된 LSST 프로젝트에 대해서 아직 준비되지 않은 국내 연구자들을 위한 고성능 컴퓨팅 자원으로서, KISTI의 GSDC와 같은 형태의 자원과 국가 슈퍼컴퓨팅 거대 계산 자원 지원을 고려할 수 있다. 더불어서 요구되는 관련 연구 수행에 연구 자원의 지원이 필요한 상황이다. 자료의 형태는 크게 기초 분석이 된 목록 자료와 기초 처리만 된 영상 자료로 구분되며, 전체 규모는 프로젝트가 끝나는 시점인 2032년에 약 0.5 EB가 예상되나, 국내 연구자들이 국내 고성능 컴퓨팅 환경에서 접근해야 하는 규모는 약 50PB으로 예상된다.

기대되는 결과는 아래와 같이 정리할 수 있다.

  • 거대 규모 과학 자료의 통계 및 기계학습 방법 활용 분석에서의 초고성능 컴퓨팅 활용 능력 확보.
  • 기초 과학 거대 자료 분석 인력 육성을 통한, 이들의 산업 및 사회에서 발생하는 거대 자료 분석에 기반 하는 산업으로의 진출 지원.
  • 국내 관련 대용량 자료의 효율적인 분석을 위한 하드웨어 및 소프트웨어 산업 활성화 기대.
  • 고성능 컴퓨팅 활용 과학적 연구 결과 및 과학 대중화 자료를 2022년 경 Google Sky와 다른 특색을 가지고 개선된 방식으로 대국민 과학 문화 활동으로 제공하여, 초고성능 컴퓨팅을 활용한 대용량 자료 분석 연구의 성과로 제시 (참고: Google은 LSST의 공식 참여 기관으로서 LSST 자료 분석의 이러한 활용에 관심을 가지고 있음).
  • 방대한 양의 태양계 소천체들의 검출 및 그 특성 분석을 통해서, 지구 충돌 혹은 근접 접근 천체들을 파악하여, 충돌 위험 대비라는 국제적인 노력에 적극기여.
  • 다수 태양계 소천체들의 괘도 및 표면 성분에 대한 기초적인 특성들을, LSST 관측 자료 분석 및 초고성능 컴퓨팅을 활용한 계산으로 추정하여, 추후 우주 개발에서 자원 채취가 가능한 소천체들을 발견하는데 기여 (참고: Mining the Heavens: Astronomers Could Spot Asteroid Prospects).
  • LSST 대용량 자료 분석을 통해서 개발된 방법론들을 활용하여, 국내외 연구자들이 준비 중인 Square Kilometer Array와 같은 대용량 관측 자료 중심의 차기 천문우주 연구 프로그램에 연속 적인 참여 가능.