뉴스룸
파네시아, 그리고 파네시아의 기술과 관련된 새로운 소식을 전합니다.
파네시아, 시드 라운드에 160억 투자유치, 기업가치 1034억 달성
Panmnesia September 14, 2023

CXL 반도체 팹리스 기업 파네시아는 최근 시드 라운드 투자를 성공적으로 마무리하였습니다. 1034억원의 투자 후 기업가치를 인정받아, 최종적으로 160억원의 투자 유치에 성공하였습니다. 국내 반도체 관련 업계에서, 시드 라운드에 1000억원 이상의 기업가치를 인정받은 사례는 매우 이례적인 일이며, 이 소식은 해외 유수 언론사인 로이터통신(Reuters)에 의해 가장 먼저 소개되었습니다. 이 외에도 나스닥(Nasdaq), 야후 파이낸스(Yahoo finance), 조선일보, ZDNet, 서울경제 등 국내외 유수 언론들이 파네시아의 시드라운드 투자 소식을 다루었습니다.

이번 투자는 대교인베스트먼트, SL인베스트먼트, 스마일게이트 인베스트먼트, 지앤텍벤처투자, 타임웍스인베스트먼트, 유안타인베스트먼트, 퀀텀벤처스코리아, 총 7개의 투자사가 참여했습니다. 파네시아는 이번 투자를 바탕으로 CXL 반도체 기술을 고도화하고, AI 응용 및 대용량 데이터 병렬 처리를 가속하는 CXL 솔루션 등을 추가적으로 개발하여 CXL 산업을 계속해서 선도해나갈 계획입니다.

국내외 언론사들의 기사 원문은 아래의 링크를 통해 확인하실 수 있습니다.

해외 언론
로이터통신[링크]
나스닥[링크]
야후파이낸스[링크]
디자인앤리유즈[링크]
일렉트로닉스위클리[링크]
eeNews 유럽[링크]
테크노드[링크]
ETCIO[링크]
테크인아시아[링크]
KrASIA[링크]
브릿지 그룹[링크]
메타버스 포스트[링크]
피치북[링크]
국내 언론
조선일보[링크]
지디넷[링크]
서울경제[링크]
IT비즈뉴스[링크]
디지털투데이[링크]
더스탁[링크]
와우테일[링크]
CEO스코어데일리[링크]
메트로신문[링크]
정보통신신문[링크]
뉴스웨이브[링크]
이뉴스투데이[링크]
파네시아, 반도체 IP 시장의 떠오르는 대표 강소기업으로써 언론에 소개
Panmnesia September 14, 2023

파네시아는 반도체 설계자산(IP) 분야의 떠오르는 국내 강소기업으로써, 조선일보 기사에 소개되었습니다.

해당 기사에서는 파네시아의 CXL 3.0 관련 독보적인 기술력, 최근 플래시 메모리 서밋(Flash Memory Summit, FMS) 2023에서의 행보들을 주목하였습니다. 이러한 기술력을 바탕으로, 미국, 영국 등 해외 기업들의 전유물로 여겨졌던 글로벌 반도체 설계자산 분야에 진출한 대표적인 국내 강소기업으로써 파네시아를 소개하였습니다.

또한, 인공지능 서비스의 수요 증가로 인해 칩이 더 다양한 기능을 수행하게 되면서, 반도체 설계자산에 대한 수요가 증가하였으며, 이러한 이유로 파네시아를 포함한 국내 반도체 설계자산 개발 회사들의 전망이 밝다고 설명하였습니다.

조선일보의 기사 원문은 아래의 링크에서 확인하실 수 있습니다.

조선일보[링크]
파네시아 CXL-SSD 관련 기술, KAIST Breakthroughs 선정
Panmnesia KAIST September 05, 2023

파네시아가 개발한 CXL-SSD 관련 기술이 KAIST Breakthroughs에 선정 및 소개되었습니다.

KAIST Breakthoughs는 한국과학기술원 주관하에, 혁신적인 공학분야(전자공학, 컴퓨터과학, 생명공학, 환경공학, 산업공학 등 모든 공학분야 포함) 연구성과를 매년 약 30건만 선정하여 소개하는 웹진(webzine)입니다. 올해에는 31건의 기술이 선정되었는데, 파네시아가 개발한, CXL-SSD의 성능을 개선하는 프리페칭 기술이 이에 포함되었습니다.

소개된 파네시아의 기술은, 차세대 인터페이스 CXL(Compute Express Link)을 활용하는 SSD(이하 CXL-SSD)와 관련된 기술입니다. CXL 인터페이스를 활용하면, 보통 외부 저장장치로써 활용되는 SSD를 거대한 시스템 메모리처럼 활용할 수 있습니다. 대용량을 제공하면서도, 빈번하게 접근되는 데이터를 호스트 단에 캐싱하여 합리적인 성능 또한 달성할 수 있기에 많은 관심을 받고 있습니다 (참고: 파네시아가 2022년도에 제안한 CXL-SSD 기술).

다만, CXL-SSD를 활용하는 시스템은, 캐시 미스가 발생하였을 때 SSD의 긴 지연시간이 노출됨으로써 성능이 크게 저하될 수 있다는 문제가 있습니다. 이번에 소개된 파네시아의 기술은, 미래에 접근할 SSD 주소를 예측하고, 해당 데이터를 미리 읽어옴으로써 SSD의 긴 지연시간이 노출되지 않도록 하는 기술입니다. 파네시아는 CXL 기반 시스템의 계층 구조에 대한 이해를 바탕으로, 기계학습을 활용하여 미래에 접근할 주소를 보다 정확하게 예측하고, 알맞은 시점에 읽어오는 방법을 개발하였습니다.

올해 KAIST Breakthoughs에서 파네시아의 기술에 대해 소개한 원문은 아래의 링크를 통해 확인하실 수 있습니다.

파네시아, Flash Memory Summit 2023 전시회 출품 성황리에 마무리
Panmnesia August 10, 2023

CXL 반도체 설계자산(IP) 개발의 선두주자 파네시아는 미국 산타클라라 컨벤션센터에서 열리는 ‘플래시 메모리 서밋 2023(Flash Memory Summit 2023, FMS 2023)’에서 자체 개발한 CXL IP들이 적용된 멀티-테라바이트 용량의 풀-시스템 CXL 프레임워크를 선보였습니다. 플래시 메모리 서밋은 매년 3천명이상이 참여하고 국내유수 대형 메모리/스토리지 회사들이 참여하는 큰 반도체 행사입니다.

최근 생성형 AI, 챗-GPT 그리고 추천 시스템 등의 대규모 응용이 상용화됨에 따라, 데이터센터에서는 대용량 메모리와 GPU등의 가속장치를 효율적으로 사용가능한 기술에 대한 요구가 급증하고 있습니다. 이러한 상황에서 등장한 CXL(Compute eXpress Link, CXL) 인터페이스 기술은 데이터센터 내 메모리 용량을 폭발적으로 확장 가능하며, 확장한 메모리 공간을 CPU 및 가속장치들이 효율적으로 사용할 수 있도록 합니다. 이로 인해, CXL은 차세대 데이터센터향 인터페이스 기술로 업계의 많은 주목을 받고 있습니다.
파네시아와 파네시아의 CXL IP: 파네시아는 CXL 인터페이스 기반의 풀-시스템 프레임워크를 세계 최초로 개발한 CXL IP 개발의 선두주자로, 데이터센터향 CXL 솔루션 실현에 필요한 모든 CXL IP를 개발 및 공급합니다. 구체적으로 파네시아가 개발 및 공급하는 CXL IP는 CXL 인터페이스의 핵심 프로토콜인 CXL 캐시 통신(CXL.cache), CXL 메모리 통신(CXL.mem), CXL 입출력 통신(CXL.io) 지원을 위한 Core CXL IP와 CXL CPU, NPU, AI 반도체, 가속기 그리고 다양한 CXL 시스템 장치에서 CXL 관련 기능을 하드웨어 자동화하는 IP들로 구성됩니다. 파네시아의 고객사들은 실리콘, 펌웨어, 소프트웨어, 운영체제 및 어플리케이션 소프트웨어등 다양한 수준에서 기 검증된 파네시아 CXL IP를 기존 장치에 적용하는 형태로 CXL 장치개발이 가능해, 개발 및 검증에 필요한 추가적인 비용과 소모시간을 줄일 수 있습니다.
파네시아의 FMS 2023 참여: 파네시아는 개발한 CXL IP들을 바탕으로, 이번 ‘플래시 메모리 서밋 2023’에 자체개발한 CXL IP가 적용된 프레임워크인 멀티-테라바이트 메모리 풀을 전시하는 한편, 메타 사의 대규모 AI 응용을 메모리 풀에서 실행하는 데모영상 또한 선보였습니다.
파네시아의 메모리풀 예제: 플래시 메모리 서밋 2023’에서 전시되는 파네시아의 멀티-테라바이트 메모리풀은 CXL 인터페이스를 지원하는 장치인 CXL CPU, CXL 스위치 그리고 CXL 메모리 확장장치로 구성되며, 고성능, 고확장성의 메모리, 높은 이식성 및 높은 효율성을 갖춘 점이 기존 데이터센터의 메모리 확장 솔루션과 차별화된 점입니다. 구체적으로, 파네시아의 멀티-테라바이트 메모리풀 프레임워크는 다수의 CXL 스위치와 CXL 메모리 확장장치를 통해 높은 성능과 폭발적인 메모리 용량 확장을 제공하며, 세계 최초로 CXL IP 하드웨어와 이를 사용하기 위한 소프트웨어를 풀-시스템으로 실장하여 기존 데이터센터의 에코시스템에 그대로 적용, 다양한 응용을 수정없이 사용 가능합니다. 또한, 파네시아의 메모리풀 프레임워크는 고도화된 CXL 스위치 기술을 통해, 확장된 메모리를 사용자 요구량에 따라 효율적으로 할당 가능하며, CXL 메모리 확장장치에는 DIMM 단위 메모리 교체방식을 적용하여, 추가적인 확장장치의 구매 비용 없이도 메모리 용량의 증설이 가능합니다. 이러한 파네시아의 메모리풀 프레임워크는 데이터센터의 메모리 자원뿐만이 아닌, 데이터센터의 운용 비용 효율화도 고려한 메모리 확장 솔루션으로 볼 수 있습니다.
파네시아 메모리풀의 데모영상과 성능: 파네시아는 풀-시스템으로 구현한 CXL 메모리풀 프레임워크에서 대표적 대규모 AI 응용인 메타 사의 추천시스템을 실제 동작시키는 과정을 데모영상으로 공개하였으며, 기존 데이터 센터의 RDMA-기반 메모리 분리기술 대비 대규모 추천시스템의 실행 시간을 3.32배 단축시킬 수 있음을 보였습니다. 이번 ‘플래시 메모리 서밋 2023’을 통해 파네시아가 공개한 CXL IP와 멀티-테라바이트 메모리풀 프레임워크는 성능, 메모리 확장 및 관리 그리고 데이터센터 운용의 비용 효율 모두를 향상시킬 수 있는 미래지향적 데이터센터 솔루션이며 CXL 동작의 단편이 아닌 실제적용을 위한 프로세서, 스위치 기술, 메모리 확장장치 등의 CXL 장치와 운영체제에 이르기까지 실 시스템을 공개한 것은 파네시아가 유일하다는 점에서 다양한 기존 데이터센터 솔루션대비 상당한 차별성이 돋보였습니다.
전자신문 지면기사 [링크]
블락스앤파일스 [링크]
스토리지뉴스레터 [링크]
지디넷 [링크]
인공지능신문 [링크]
전자신문 [링크]
디지털투데이 [링크]
파네시아의 출품 소식은 전자신문 지면 기사, 블락스앤파일스(Blocks & Files), 스토리지뉴스레터(Storage Newsletter) 기사를 포함하여 다수의 국내외 언론에서 소개되었습니다. ‘플래시 메모리 서밋’에서 공개된 CXL 메모리 풀의 데모 영상은 하단의 유튜브 링크에서 다시 시청할 수 있습니다.
파네시아, Flash Memory Summit 2023 전시회 참여
Panmnesia July 30, 2023

파네시아는 올해 8월 8일부터 3일간 미국 캘리포니아에서 열리는 Flash Memory Summit(플래시 메모리 서밋, FMS) 2023 전시회에 참여합니다.

삼성전자, 하이닉스, 키옥시아(KIOXIA), ARM 등 국내외 유수 기업이 대거 참여하는 이번 전시회에서, 파네시아는 자체적으로 개발한 풀-시스템 CXL(Compute Express Link) 프레임워크를 출품할 예정입니다.

CXL CPU, CXL 스위치, 그리고 CXL 메모리 확장장치로 구성된 해당 프레임워크는, 멀티-레벨 스위치 구조를 활용함으로써 다수의 메모리 장치를 CPU에 연결시킬 수 있습니다. 결과적으로, 파네시아의 프레임워크를 활용하는 사용자는 수 테라 바이트 이상의 메모리 공간을 제공받을 수 있습니다. 뿐만 아니라, 사용자들은 파네시아 CXL 프레임워크의 DIMM(Dual In-line Memory Module) 단위 풀링 기술을 통해 운영 비용 절감 효과 또한 누릴 수 있습니다.

파네시아의 풀-시스템 프레임워크는 리눅스 운영체제 기반의 소프트웨어 스택 또한 포함하기 때문에, 일반적인 워크로드들이 별다른 수정 없이 동작할 수 있습니다. 실제로, 이번 FMS 전시회에서 파네시아는 대표적인 대규모 AI 응용인 추천시스템을 CXL 프레임워크 상에서 실행하는 데모를 보여줄 예정입니다.

파네시아의 출품 및 데모는 655번 부스에서 진행됩니다. FMS 전시회 관련 보다 자세한 정보는 아래의 링크에서 확인할 수 있습니다.

파네시아, SIGARCH Korea Workshop에서 초청 연설 진행
Panmnesia July 21, 2023

파네시아는 7월 21일 서울대학교에서 개최된 SIGARCH Korea Workshop 2023(SIGARCH 코리아 워크샵 2023) 행사에서 초청 연설을 진행했습니다.

‘Breaking Down CXL: Why It’s Crucial and What’s Next’라는 제목으로 진행된 해당 연설에서는 파네시아의 CXL 기술 및 관련 데모를 소개하였으며, 컴퓨터 아키텍처 분야를 전공하는 여러 연구자들과 CXL 기술에 대해 논의하였습니다.

올해 SIGARCH Korea Workshop에는 파네시아를 포함하여 메타, 삼성전자, 리벨리온 총 4개 기관이 기업으로써 초청 발표를 진행하였습니다.

파네시아, OCP APAC Tech Day에서 초청 연설 진행
Panmnesia July 04, 2023

파네시아는 7월 4일 서울 코엑스에서 열린 OCP APAC Tech Day(오픈컴퓨트프로젝트 아시아퍼시픽 테크 데이)에서 초청 연설을 진행하였습니다.

해당 연설에서, 파네시아는 CXL(Compute Express Link) 기술의 필요성을 설명하고, CXL 기술을 적용하기에 적절한 응용들에 대하여 소개하였습니다. 구체적으로, CXL을 활용하여 대규모 기계학습 응용을 가속하는 방법에 대하여 소개하였습니다.

올해 OCP APAC Tech Day에서는 파네시아 외에도 AMD, 삼성전자, SK하이닉스, SK텔레콤, ETRI 등 국내외 유수 기업/기관이 발표를 진행하였습니다. 행사 관련 자세한 내용은 아래의 링크를 통해 확인할 수 있습니다.

파네시아의 CXL 3.0 기반 AI 벡터 검색 시스템, 해외 언론에서 소개
Panmnesia June 21, 2023

파네시아가 개발한 AI 벡터 검색 시스템, CXL-ANNS가 다수의 해외 언론에서 소개되었습니다.

CXL-ANNS는 CXL 3.0(Compute Expreses Link 3.0) 기반 메모리 풀을 활용하여 AI 벡터 검색을 가속하는 시스템으로써, 오는 7월 미국 보스턴에서 열리는 USENIX ATC 학회에 발표될 예정입니다. 파네시아가 개발한 CXL-ANNS 시스템은, 수십 테라바이트에 달하는 벡터 검색 데이터를 대규모 CXL 메모리 풀에 온전하게 저장하며, 데이터 근처 연산 기법을 활용하여 검색 동작을 가속합니다.
산업계가 주목하는 기술인 CXL을 활용하여, 최근 글로벌 IT기업들이 본격적으로 활용하기 시작한 AI 벡터 검색 응용을 가속한 이번 연구는 여러 해외 언론에 의해 소개되었습니다. 특히 메모리/스토리지 관련 기술을 전문적으로 다루는 블락스앤파일스(Blocks & Files)와 뉴일렉트로닉스(New Electronics)에서 가장 먼저 기사 형태로 파네시아의 연구 내용을 다루었습니다. 관련 기사 원문은 아래 링크를 통해 각각 확인할 수 있습니다.
블락스앤파일스 [링크]
뉴일렉트로닉스 [링크]
파네시아, 차세대 CXL-SSD를 위한 프리페칭 기법 개발
Panmnesia May 20, 2023

메모리 및 스토리지 솔루션을 선도하는 기업, 파네시아는 SSD(Solid-State Drive) 관련 신기술인 ExPAND를 개발하였습니다. 해당 기술은 올해 7월 미국 보스턴에서 열리는 ACM HotStorage 학회에서 발표될 예정입니다.

파네시아가 개발한 ExPAND는 차세대 인터페이스 기술인 CXL(Compute Express Link)을 SSD에 접목시키는 것을 가능하게 하는 기술입니다. 해당 기술을 활용하면, SSD를 대용량 메모리처럼 사용할 수 있게 됩니다. 물론 DRAM보다 훨씬 느린 SSD 장치를 단순히 메모리로써 사용하면 기존의 DRAM 기반 메모리 시스템보다 성능이 크게 저하된다는 문제가 있습니다. ExPAND는 라스트-레벨 캐시(Last-Level Cache, LLC)의 프리페칭(prefetching, 추후 접근할 데이터를 캐시로 미리 옮겨두어 지연을 최소화하는 기법) 동작을 CXL-SSD가 주관하도록 하여 이러한 성능 저하 문제를 최소화하였습니다.
파네시아가 개발한 ExPAND 기술은, 프리페치할 데이터를 적절하게 선정하는 다양한 알고리즘을 포함합니다. 어떤 데이터를 프리페치할 지뿐만 아니라, 언제 데이터를 프리페치하는 것이 적절한 지 또한 판단하여 예상치 못한 지연 상황을 최소화합니다. ExPAND는 CXL 멀티-레벨 스위치 구조를 고려하여 설계되었다는 점에서 또한 차별화됩니다. 스위치를 활용한 이상적인 확장 환경에서, CXL-SSD를 접근하는 데 걸리는 지연시간을 보다 정확하게 예측할 수 있습니다.
결론적으로 파네시아의 ExPAND 기술을 활용하면 프리페칭 동작의 효과로, 느린 SSD가 아니라 빠른 호스트 캐시에 직접 접근하는 빈도가 크게 증가하게 됩니다. ExPAND의 성능을 측정한 결과, 그래프 응용의 성능을 2.8배 향상시킬 수 있음을 확인하였습니다.
ExPAND가 HotStorage 학회에 선정된 것은 해당 기술이 기존의 데이터 접근/관리 방식을 크게 뒤바꿀 잠재력이 있음을 시사합니다. 파네시아는 "이번에 공개한 ExPAND 외에도 다양한 메모리/스토리지 솔루션을 개발하여 산업계를 선도하는 위치를 고수할 것"이라며 포부를 밝혔습니다.
파네시아, CXL 기반 AI 응용 가속 솔루션 'Hearst' 개발
Panmnesia May 11, 2023

파네시아는 CXL(Compute Express Link) 기반의 대규모 AI 응용 가속 솔루션 Hearst를 공개하였습니다.

최근 추천시스템, 벡터 검색, 그래프 신경망과 같은 AI 기반 응용 서비스가 널리 활용되고 있습니다. AI 기반 응용의 정확도는 일반적으로 학습 데이터 혹은 모델의 크기에 비례하며, 따라서 최근 기업 데이터센터에서 실제로 동작하는 AI 기반 응용들의 경우에 수 테라바이트, 혹은 수십 테라바이트에 달하는 대규모 데이터를 활용하는 경우가 많습니다.
이처럼 대규모 AI 응용 가속에 대한 수요가 증가하였으나, 현재 상용화된 GPU 가속기의 경우 DRAM 기술의 한계로 내부 메모리 용량이 수십 기가바이트 수준에 머물러 있어 대규모 AI 모델 응용을 지원하기에는 현실적인 어려움이 있습니다.

파네시아는 CXL 기반 메모리 확장 기술을 활용하여, 대규모 AI 응용 가속 시 발생하는 메모리 용량 문제를 해결하는 솔루션, Hearst를 개발하였습니다. Hearst를 활용하면 단 몇 대의 가속기/연산장치 만으로도 추천시스템, 벡터 검색과 같은 대규모 AI 응용을 가속할 수 있습니다.

Hearst의 특징을 요약하면 다음과 같습니다.
1. 고확장성: Hearst는 포트-기반 라우팅 (Port-Based Routing, PBR) CXL 스위치를 활용합니다. 이를 통해, 수백 개 이상의 메모리 장치를 연결하여 대용량 메모리 풀(memory pool) 구성이 가능하며, 대용량 데이터를 온전히 저장할 수 있습니다.
2. 고성능: Hearst는 데이터 근처 연산 기법 (Near Data Processing, NDP)을 활용합니다. 즉, 처리해야 하는 데이터가 저장된 메모리 풀에서, 간단한 연산을 통해 데이터의 크기를 줄인 후 호스트 CPU로 이동시킵니다. 이를 통해 데이터 이동 오버헤드를 줄임으로써 처리 성능을 향상시키고, 전력 소모 또한 절감할 수 있습니다.
3. 저비용: Hearst는 DIMM(Dual In-line Memory Module) 단위 풀링 기술을 활용합니다. 즉, 메모리 풀의 용량을 늘리거나 메모리 장치를 교체하고 싶을 때, 메모리 확장장치 단위가 아닌 DIMM 단위로 교체함으로써 소모/관리 비용을 절감합니다.
Hearst와 관련된 보다 자세한 정보는 아래 링크를 통해 확인할 수 있습니다.
파네시아, CXL 3.0 기반의 ANNS 응용 가속 기술 개발
Panmnesia KAIST April 29, 2023

파네시아는 CXL 3.0(Compute Express Link 3.0)을 활용해, 대규모 AI 응용인 ANNS(Approximate Nearest Neighbor Search, 근사 근접 이웃 탐색) 응용을 가속하는 기술을 개발하였습니다. 해당 기술은 올해 7월 미국 보스턴에서 열리는 USENIX ATC 학회에서 발표될 예정입니다.

ANNS란?
최근 각광받고 있는 이미지 검색, 데이터베이스, 추천 시스템, 광고 등의 서비스들은 마이크로소프트, 메타, 알리바바 등의 글로벌 IT 기업들에서 활발히 제공되고 있습니다. 이 서비스들은 직접적으로 비교하기 힘든 종류의 데이터의 유사점을 찾아야 하는 어려움이 있습니다. 예를 들어 이미지 검색의 경우, 기존의 텍스트 기반 검색들과는 다르게, 서로 간의 유사도를 구하기가 힘들어 비슷한 이미지를 찾는 데 어려움이 있습니다. 게다가 커다란 데이터셋에서 사용자가 요구하는 데이터를 높은 정확도로 짧은 시간 안에 찾아내야 하는 요구사항을 가지고 있습니다.
이러한 서비스에서 주로 사용되는 알고리즘이 바로 ANNS입니다. AI의 발전으로 우리는 어떤 데이터든지 특성 벡터로 표현할 수 있게 되었습니다. 특성 벡터란 데이터가 가지는 특성들 각각을 숫자로 표현해 나열한 것으로, 이들 사이의 거리를 통해 우리는 데이터 간의 유사도를 구할 수 있습니다. ANNS 알고리즘은 특성 벡터로 표현되는 수많은 데이터 중 주어진 쿼리 벡터와 가장 가까운 특성 벡터들을 찾아내는 작업을 수행합니다.
ANNS의 특성 및 기존의 연구들
하지만 실제 서비스에서 사용되는 데이터 셋은 매우 커, 많은 양의 메모리를 요구하는 단점이 있습니다. 기존 시스템에서는 추가할 수 있는 메모리 용량에 제한이 있어 이러한 요구사항을 만족할 수 없었습니다. 그래서 벡터 데이터를 압축하여 메모리에 적재하는 압축 기반 방식과 메모리보다 큰 용량과 느린 속도를 가지는 저장 장치를 사용하는 스토리지 기반 방식(마이크로소프트에서 사용 중)이 사용되어 왔습니다. 하지만 이들 각각은 낮은 정확도와 성능을 가지는 문제가 있었습니다.
파네시아의 제안: CXL 기반 가속 기술
이에 파네시아는 메모리 확장의 제한이라는 근본적인 문제를 해결하기 위해 CXL이라는 기술에 주목하였습니다. CXL은 PCIe 인터페이스 기반의 CPU-장치 간 연결을 위한 프로토콜로, 가속기 및 메모리 확장장치의 고속 연결을 제공합니다. 또한 CXL 스위치를 통하여 여러 대의 메모리 확장장치를 하나의 포트에 연결할 수 있는 확장성을 제공합니다. 하지만 CXL을 통한 메모리 확장은 로컬 메모리와 비교하였을 때, 메모리 접근 시간을 증가시킨다는 단점을 가지고 있습니다.
데이터를 책으로 비유하자면 기존 시스템은 집(CPU) 크기의 제한으로 서재(메모리 용량)를 무한정 늘릴 수 없어, 보관할 수 있는 책 개수에 제한이 있는 것입니다. 이에 압축 기반 방식은 책의 내용을 압축하여 더 많은 책을 보관하는 방법이고, 스토리지 기반 방식은 필요한 책들을 거리가 먼 도서관에서 구해오는 것과 비슷합니다. CXL을 통한 메모리 확장은 집 옆에 창고를 지어 책을 보관하는 것으로 이해될 수 있습니다.
파네시아가 개발한 가속 기술은 CXL 스위치와 CXL 메모리 확장장치를 사용해 ANNS 응용에서 필요로 하는 모든 데이터를 메모리에 적재할 수 있으며, 이를 통해 정확도와 성능 감소를 없앴습니다. 또한 ANNS 응용의 특징을 고려하여 설계된 '데이터 근처 처리 기법'과 '데이터 배치 기법'을 적용하여, 성능을 한 단계 더 향상시켰습니다. 구체적으로, 여러 특성 벡터와 쿼리 벡터 사이의 거리를 계산하는 가속기를 CXL 메모리 확장장치에 배치했습니다. 이에 따라 CXL 메모리 확장장치는 계산의 결과만을 CPU로 전송하여 데이터 이동량을 감소시킬 수 있습니다. 또한 그래프를 사용하는 ANNS 응용에서, 탐색을 시작하는 진입 노드와 근접한 노드들이 더 자주 접근된다는 점을 활용하여, 근접 노드들을 로컬 메모리에 배치하는 것으로 CXL 메모리 확장장치로의 접근을 최소화하였습니다. 이는 마치 창고 스스로가 필요한 책들의 내용을 요약/정리해 전달하고, 자주 보는 책들은 서재에 배치하여 집과 창고를 오가는 시간을 줄이는 것과 유사합니다.
파네시아는 개발한 기술의 프로토타입을 자체 제작하여 실효성을 확인하고, 성능을 기존 연구들과 비교하였습니다. 마이크로소프트, 메타, 얀덱스 등의 글로벌 IT기업에서 공개한 검색 데이터 셋을 사용하여 ANNS 응용의 성능을 비교한 결과, 파네시아가 개발한 가속 기술은 기존 연구들보다 평균적으로 111배 뛰어난 성능을 보였습니다.
해당 연구 내용은 다수의 기사를 통해 소개되었습니다. 관련 내용은 아래의 링크를 통해 확인할 수 있습니다.
동아일보 지면
헤럴드경제 지면
전자신문 지면
조선일보[링크]
동아사이언스[링크]
베리타스알파[링크]
인공지능신문[링크]
서울경제[링크]
전자신문[링크]
헤럴드경제[링크]
충청일보[링크]
충청뉴스[링크]
AI타임스[링크]
보안뉴스[링크]
금강일보[링크]
테크월드[링크]
신아일보[링크]
뉴스원[링크]
뉴스데일리[링크]
국제뉴스[링크]
워크투데이[링크]
글로벌이코노믹[링크]
머니S[링크]
인더스트리뉴스[링크]
전국매일신문[링크]
시티저널[링크]
한국강사신문[링크]
헬로디디[링크]
파네시아의 CXL 3.0 기반 AI 가속 프레임워크, 포브스 등 해외 언론에서 소개
Panmnesia April 25, 2023

파네시아가 개발한 AI 가속 프레임워크, TrainingCXL이 포브스 등 다수의 해외 언론에서 소개되었습니다.

TrainingCXL은 GPU와 CXL 3.0(Compute Express Link 3.0) 기반 비휘발성 메모리 풀을 활용하여 대규모 AI 응용을 가속하는 프레임워크로써, 올해 초 IEEE Micro에 논문 형태로 공개되었습니다. 해당 기술을 활용하면 GPU가 대용량 CXL 메모리 풀에 낮은 지연으로 접근 가능하며, 결과적으로 단 몇 대의 GPU만으로도 추천시스템과 같이 수십 테라바이트 수준의 데이터를 활용하는 대규모 AI 응용을 가속할 수 있게 됩니다.
최근 산업계와 학계에서 많은 관심을 받고 있는 CXL 기술을 적절히 활용하여 대규모 AI 응용을 가속하는 획기적인 연구이기에, 다수의 해외 언론이 관심을 보였습니다. 특히 해외 유수 언론인 포브스(Forbes), 그리고 메모리/스토리지 관련 기술을 전문적으로 다루는 스토리지뉴스레터(Storage Newsletter)와 블락스앤파일스(Blocks & Files)에서 가장 먼저 기사 형태로 파네시아의 연구 내용을 다루었습니다. 관련 기사 원문은 아래 링크를 통해 각각 확인할 수 있습니다.
포브스 [링크]
스토리지뉴스레터 [링크]
블락스앤파일스 [링크]
파네시아, 국내 언론 인터뷰 진행
Panmnesia March 06, 2023
파네시아는 CXL(Compute Express Link) 등 캐시 일관성 보장 인터커넥트(Cache Cohrerent Interconnect, CCI) 관련 기술 개발을 선도하는 기업으로써, 최근 산업계, 특히 메모리 및 컴퓨팅 관련 업계에서 많은 주목을 받고 있습니다. 국내 언론사, 서울 파이낸스는 이러한 파네시아의 비전, 그리고 CXL 기술과 관련된 인터뷰를 진행하였습니다.
해당 인터뷰에서, 파네시아는 먼저 CXL 기술에 대해 간략히 소개하였습니다. CXL은 고성능 대용량 메모리를 실현하는 데 있어 핵심이 되는 인터커넥트 기술이며, 대규모 응용 처리를 위해 더욱 더 많은 메모리를 원하는 빅테크 업체(구글, 메타 등)의 니즈를 충족시킬 수 있는 대안이라고 설명하였습니다.
인터뷰에서는 파네시아의 발빠른 행보에 대해서도 다루었습니다. 카이스트 교원창업기업인 파네시아는 업력이 2년차 밖에 되지 않았지만, 이미 CXL 표준 지식재산권(IP)을 포함해 수십 건의 IP를 확보하였고, 이를 통해 국내외 유수 기관으로부터 협업 제의를 받고 있다고 설명하였습니다.
보다 구체적인 내용은 아래의 링크를 통해 확인할 수 있습니다.
파네시아의 CXL 기술 개발 흐름
서울파이낸스 인터뷰[링크]
파네시아, CXL 관련 비공개 워크샵에서 초청 연설
Panmnesia KAIST February 16, 2023

파네시아는 2월 16일 열린 CXL(Compute Express Link) 관련 비공개 워크샵에서 AMD, 삼성전자, SK하이닉스 등 CPU 및 메모리 산업을 선도하는 글로벌 기업들과 함께 초청 연설을 진행하였습니다.

'Why CXL? Why Does It Matter? and Where Are We?'라는 제목으로 진행된 해당 연설에서, 파네시아는 메모리 확장의 필요성과 기존 메모리 확장 솔루션의 비용/성능 측면 한계에 대해서 설명하고, CXL 기술이 관련 문제를 해결할 수 있음을 설명하였습니다. CXL 관련 기술 개발 동향, 그리고 파네시아의 CXL 기반 하드웨어/소프트웨어 통합 솔루션에 대해서도 설명하였습니다.
해당 행사에서는 CXL 관련 기술 개발 방향과 관련 연구 주제에 대한 논의도 진행되었습니다. 파네시아는 데이터 근처 연산 (Near Data Processing, NDP), AI 응용 가속 등 데이터 중심 응용을 가속하는 최신 연구 주제에 관한 의견을 공유하였습니다.
파네시아는 "산업계를 선도하는 유수의 기업들과 기술 개발 내용을 공유하고, CXL과 관련된 깊은 논의를 할 수 있는 좋은 자리였다"며 감회를 밝혔습니다.
파네시아, CXL 3.0 기반 AI 가속 시스템 개발
Panmnesia January 08, 2023

파네시아는 CXL 3.0(Compute Express Link 3.0)을 활용해, 확장가능한 메모리와 높은 성능을 제공하는 AI 가속 시스템을 개발하였습니다. 개발한 시스템은 GPU에 최대 4페타바이트(10^15 byte)의 확장가능한 메모리를 제공함과 동시에, 기존 PCIe 기술을 기반으로 대용량 메모리를 연결한 시스템 대비 AI 모델의 학습시간을 5.3배 단축할 수 있습니다. 해당 기술은 IEEE Micro에 논문의 형태로 공개되었습니다.

대규모 AI 가속 시스템에 대한 수요와 기존 시스템의 한계
보유한 AI의 품질이 기업의 경쟁력을 좌우하는 요소로 떠오르며, 글로벌 기업들은 앞다투어 자사 AI의 정확도를 높이기 위해 모델의 크기를 키우고 있는 추세입니다. 이에 따라, 테라바이트(10^12 byte) 수준 이상의 대규모 AI를 처리할 수 있는 컴퓨팅 시스템에 대한 업계의 관심이 높아지고 있습니다. 한편, 대표적인 AI 가속장치인 GPU는 DRAM 기술의 한계로 인해 내부 메모리 용량이 수십 기가바이트(10^9 byte)에 머물러 있어 대규모 모델을 지원하기에는 그 용량이 턱없이 부족한 실정입니다. 이를 위해 기존 시스템은 GPU의 메모리를 저장장치인 솔리드 스테이트 드라이브(SSD)를 이용하여 확장하는 방법을 시도했으나, SSD의 느린 임의읽기 성능과 SSD-GPU간 데이터 이동으로 인해 그 성능이 제한적이었습니다.
파네시아의 제안: CXL 3.0 기반 AI 가속 시스템
파네시아는 학술공동연구를 통해 CXL 인터페이스를 통해 대용량의 메모리 공간을 제공하는 메모리 확장장치를 GPU와 연결한 AI 가속 시스템을 개발했습니다. 개발한 시스템 TrainingCXL은 대용량 뉴메모리를 탑재한 메모리 확장장치와 GPU를 레고 블락 조립하듯 자유롭게 연결하여 GPU에 대용량의 메모리 공간을 제공합니다.
제안하는 시스템의 핵심: CXL 인터페이스
시스템의 핵심은 차세대 메모리 인터페이스인 CXL입니다. CXL은 시스템의 장치 간 연결을 위한 프로토콜로, 이 프로토콜을 지원하는 시스템은 CPU, GPU, 메모리 확장장치와 같은 다수의 장치를 자유롭게 연결하면서도 장치 간에 고속으로 데이터를 주고받을 수 있는 것이 특징입니다. 이러한 특징 덕분에, CXL은 글로벌 빅테크 기업의 데이터센터나 고성능컴퓨터에서 사용자 응용에 대용량 메모리를 제공할 방법으로 부상하고 있습니다. 파네시아는 CXL을 통해 메모리 확장장치를 GPU와 연결하여 GPU에 대용량 메모리를 제공하면서, 장치 간 데이터 이동으로 인한 실행시간 지연을 최소화했습니다. 특히, 이번 연구는 CXL 프로토콜이 정의하는 여러가지 서브프로토콜 중 cxl.cache를 사용하여 GPU 및 메모리 확장장치가 능동적으로 데이터를 주고받을 수 있도록 설계한 것이 특징입니다. cxl.cache를 통한 능동적인 고속 데이터 이동은 데이터 이동시간이 장치의 계산시간에 가려져 사용자에게 드러나지 않도록 하고, 추가적인 소프트웨어의 개입을 제거하여 높은 성능을 보입니다.
메모리 확장장치에서의 연산을 통한 추가적인 가속
파네시아는 대용량의 메모리를 제공할 뿐 아니라, 메모리 확장장치에 목표 응용을 위한 처리 능력을 부여하여 실행시간을 단축했습니다. 목표 응용은 유튜브, 인스타그램과 같은 서비스에서 사용자에게 알맞은 콘텐츠를 추천해주는 역할을 해주는 추천시스템입니다. 추천시스템은 각 사용자에게 맞는 추천을 위해 수억 명의 사용자 및 콘텐츠 각각에 대한 정보(임베딩 벡터, embedding vector)를 AI 모델에 포함하여 모델의 크기가 수십 테라바이트에 이릅니다. 이는 최근 주목받고 있는 생성형 AI 모델 ChatGPT의 수 배에 달하는 크기로, 실행을 위해 대용량의 메모리가 꼭 필요합니다. 파네시아는 추천시스템 모델의 임베딩 벡터를 메모리 확장장치에 저장하고, 메모리 확장장치 내부에 임베딩 벡터를 처리할 수 있는 가속모듈을 탑재했습니다. 가속모듈은 모델 학습 시 임베딩 벡터를 빠르게 처리할 뿐 아니라, 시스템이 원본 임베딩 벡터 대신 처리를 통해 크기가 작아진 벡터를 GPU에 전송하도록하여 데이터 이동량과 시간을 줄여줍니다. 원본 임베딩 벡터가 거대한 원석이라면, 처리한 벡터는 가공된 반지라고 비유할 수 있습니다. 고객에게 반지를 전달하고자 할 때, 고객 근처까지 거대한 원석을 모두 운송한 다음 가공하는 대신 원석의 산지 근처에서 원석을 반지로 가공한다음 반지만을 전달하는 것이 운송에 필요한 노력과 운송량을 줄일 수 있는 것과 같습니다.
개발된 시스템은 기존 PCIe 기술을 기반으로 대용량 뉴메모리를 연결한 최신 시스템 대비 다양한 종류의 추천시스템 모델을 이용한 평가에서 학습시간을 5.3배 단축하여 그 효과를 보였습니다. TrainingCXL은 대규모 AI를 위한 차세대 시스템 설계에 CXL을 활용할 방향을 제시할 수 있을 것으로 기대됩니다.
파네시아는 “메모리 반도체의 미래 먹거리인 CXL 기술을 선도하여 관련 시장과 환경을 활성화하기 위해 앞으로도 꾸준히 높은 수준의 연구성과를 공개하고 많은 반도체 및 시스템 회사들이 CXL을 사용할 수 있도록 관련 인프라를 제공할 것”이라며 포부를 밝혔습니다. 해당 연구 내용은 다수의 기사를 통해 소개되었습니다. 관련 내용은 아래의 링크를 통해 확인할 수 있습니다.
인공지능신문[링크]
IT비즈뉴스[링크]
한국강사신문[링크]
충청타임즈[링크]
워크투데이[링크]
서울경제[링크]
파네시아, CXL 기반 메모리 분리 기술 개발
Panmnesia KAIST January 07, 2023

파네시아는 CXL(Compute Express Link) 기반의 메모리 분리(memory disaggregation) 기술을 개발하였습니다. 해당 기술은 IEEE Micro에 논문의 형태로 공개되었습니다.

CXL은 프로세서, 가속기, 메모리 장치 등 다양한 시스템 장치에 대하여 효율적인 자원 분리를 가능케 하기에 산업계에서 많은 관심을 받고 있습니다. 현재는 실제로 상용화된 CXL 장치가 충분하지 않아 일반 기업이 활용하기 어려우나, 근 미래에는 가장 실용적인 메모리 자원 분리 솔루션으로써 널리 활용될 것으로 기대됩니다.
파네시아는 해당 논문에서 '호스트가 직접적으로 원격 메모리에 접근할 수 있는 형태의 CXL 기반 메모리 분리 기술'을 제안하였습니다. 이 기술을 통해, 기존의 메모리 분리 기법 활용 시 발생하던 성능 저하 문제와 비용 효율성 문제를 해결할 수 있습니다. 제안하는 기술을 통해 최종적으로 구성 가능한 고효율, 고성능, 저지연 메모리 분리 솔루션은 산업계에 큰 변화를 일으킬 잠재력을 갖추고 있습니다.
해당 논문에서는 CXL 3.0에 새롭게 추가된 기능이 무엇이며, CXL 3.0의 새로운 기능을 활용하여 어떻게 '필요에 맞게 구성 가능한 서버 구조(composable server architecture)'를 구축할 수 있는지에 대해서도 소개하고 있습니다.
관련하여 보다 자세한 내용은 아래 링크에서 확인할 수 있습니다.
파네시아, CXL 관련 초청 세미나 진행
Panmnesia December 13, 2022

CXL(Compute Express Link) 기술에 대해 산업계/학계의 관심이 집중되고 있습니다. 파네시아는 CXL 및 메모리/스토리지 솔루션 선도 기업으로써, 최근 반도체공학회, 서울대학교, 한국정보과학회, IITP(정보통신기획평가원) 등 다수 기관의 초청을 받아 CXL 세미나를 진행하였습니다.

가장 최근 행사로써, 올해(23년) 5월 30일에는 반도체공학회의 초청을 받아 'ChatGPT와 인공지능반도체의 미래기술 워크숍' 행사에서 CXL 관련 세미나를 진행하였습니다. 'CXL을 활용한 대규모 AI 가속 솔루션'이라는 제목으로 진행된 해당 발표에서는 CXL 기술을 활용하여 대규모 AI 응용인 추천시스템의 학습 과정을 가속하는 솔루션에 대하여 소개하였습니다.
반도체공학회 세미나 발표사진 1
반도체공학회 세미나 발표사진 2
반도체공학회 세미나 발표사진 3

올해(23년) 5월 23일에는 프렌들리에이아이(FriendliAI)의 대표이자 서울대학교 교수인 전병곤 대표님의 초청을 받아 서울대학교에서 단독 세미나를 진행하였습니다. ‘Unlocking the Power of CXL: Navigating the Future of Cutting-Edge Technology’라는 제목으로 진행된 해당 세미나에서는 CXL에 대한 개념, 그리고 CXL 기술을 활용하여 응용을 가속한 두 가지 연구 사례를 소개하였습니다.

서울대학교 세미나 발표사진 1
서울대학교 세미나 발표사진 2
서울대학교 세미나 발표사진 3

올해(23년) 2월 7일에는 한국정보과학회의 초청을 받아 ‘2023 컴퓨터시스템소사이어티 동계학술대회’에서 CXL 관련 세미나를 진행하였습니다. ‘CXL의 필요성, 그리고 최신 CXL 기반 기술’이라는 제목으로 진행된 해당 발표에서는 CXL 기반 메모리 확장의 필요성, 그리고 파네시아가 생각하는 실질적인 CXL 기반 시스템 구성 방식에 대하여 소개하였습니다.

작년(22년) 12월 13일에는 IITP의 초청을 받아 서울 코엑스에서 개최된 '2022 PIM인공지능반도체 전략기술 심포지엄' 행사에서 기조연설을 진행하였습니다. 'Compute Express Link를 이용한 스케일러블한 고성능 메모리 자원 세부화'라는 제목으로 진행된 해당 연설에서는 CXL을 활용하여 고성능/고확장성 메모리 솔루션을 구축하는 방법, 그리고 파네시아가 개발한 CXL 기반 솔루션에 대해 소개하였습니다. 이 날 행사에서는 파네시아 외에도 삼성전자 (연설자 손교민 마스터), SK하이닉스 (연설자 전준현 부사장) 등 국내 대표 메모리 반도체 기업들의 기조연설도 진행되었습니다.
한국정보과학회 발표사진 1
한국정보과학회 발표사진 2
IITP 인공지능반도체 심포지엄 발표사진 1
IITP 인공지능반도체 심포지엄 발표사진 2

이 외에도 파네시아는 오픈컴퓨트프로젝트(Open Compute Project, OCP), 한국정보과학회 등 다양한 기관들로부터 세미나를 요청 받아 진행할 예정입니다. 각 세미나와 관련된 보다 자세한 정보는 아래 링크를 통해 확인할 수 있습니다.

파네시아, 인텔, 마이크로소프트, LBNL과 함께 SC'22 CXL 패널 참여 및 기조연설 진행
Panmnesia KAIST November 21, 2022
파네시아는 SC(SuperComputing)'22 학회에 CXL(Compute Express Link) 패널로써 참여하였습니다. AMD, 인텔 주관하에 진행된 CXL 패널 미팅에는 파네시아 외에도 마이크로소프트, 인텔, LBNL(Lawrence Berkeley National Laboratory, 미국 로렌스버클리국립연구소)의 대표인사들이 참여하였습니다. 패널 미팅에서는 고성능컴퓨팅(High Performance Computing, HPC) 환경에서 CXL을 어떻게 활용할 것이며, 이 때 발생하는 챌린지들을 어떻게 해결할 지에 대한 논의를 나누었습니다.
파네시아는 해당 행사에서 개회 기조연설(opening distinguished lecture) 또한 진행하였습니다. 'Putting Memory and Computing in a Single Pool over CXL'라는 제목으로 진행된 해당 연설에서는, CXL 스위치와 CXL 3.0 기술을 활용하여 '필요에 맞게 구성 가능한 시스템 구조(true composable architecture)'를 구성하는 방법에 대해 중점적으로 소개하였습니다. CXL 3.0 표준의 기능들을 활용하여, 서버 랙 수준(rack-scale)의 연결이 가능하다는 사실 또한 강조하였습니다.
파네시아는 '해외 유수 기업 및 연구소와 의미있는 논의를 나눌 수 있는 기회였으며, 앞으로도 기술 개발을 선도하는 입장에서 서로 많은 교류를 나누기를 희망한다'며 감회를 밝혔습니다. 행사와 관련된 보다 자세한 내용은 아래 링크에서 확인할 수 있습니다.
파네시아, CXL 포럼 2022에 연사로써 초청
Panmnesia KAIST July 22, 2022
파네시아는 CXL(Compute Express Link) 컨소시엄 및 멤버지(MemVerge)가 주관하는 CXL 포럼 2022(CXL Forum 2022)에 연사로써 초청되었습니다. 해당 행사는 플래시메모리서밋(Flash Memory Summit)에서 가장 인기 있는 세션 중 하나로, CXL 기술 개발을 선도하는 연구자나 기업인들이 한 데 모여 CXL 기술 개발 방향을 논의하는 행사입니다. 파네시아 이외에도 ARM, 키옥시아, 시놉시스 등의 기업이 연사로 참여하였습니다. 파네시아는 해당 행사에서 두 가지 서로 다른 주제로 발표를 진행할 예정입니다.
'CXL-SSD: Expanding PCIe Storage as Working Memory over CXL'이라는 제목으로 진행될 첫번째 발표에서는, CXL을 활용하여, SSD와 같은 블락 스토리지를 시스템 메모리처럼 활용하는 방법에 대해 다룹니다. 구체적으로, SSD를 시스템 메모리처럼 활용하고자 할 때 가장 적합한 CXL 서브프로토콜, SSD를 시스템 메모리처럼 활용할 때 발생하는 문제, 해당 문제를 해결하는 솔루션 등의 내용을 다룰 예정입니다.
'CXL 2.0-based End-to-End System for High-Performance Memory Disaggregation'이라는 제목으로 진행될 두번째 발표에서는, CXL 2.0 CPU, CXL 2.0 스위치, CXL 2.0 메모리 확장장치를 활용하여 구성 가능한 고성능 메모리 분리(memory disaggregation) 시스템에 대하여 다룰 예정입니다.
프로그램과 관련된 보다 자세한 내용은 아래 링크를 통해 확인할 수 있습니다.
파네시아의 CXL 2.0 기반 단대단 시스템 프로토타입, 해외 유수 언론 더넥스트플랫폼에서 소개
Panmnesia KAIST July 20, 2022

파네시아가 세계 최초로 공개한 CXL 2.0 단대단 시스템 프로토타입, DirectCXL이 해외 언론 더넥스트플랫폼(The Next Platform)에 소개되었습니다. 참고로, 더넥스트플랫폼은 메모리 및 컴퓨팅 분야 유수 언론으로, 관련 분야의 선도적인 기술을 깊이 있게 다룹니다. 삼성전자, LG전자를 제외하면, 국내 기업의 기술이 해당 언론에서 중점적으로 다루어진 경우가 없습니다.

해당 기사에서는 파네시아의 CXL 2.0 기반 단대단 시스템 프로토타입에 대해 소개하면서, 파네시아가 메타, 마이크로소프트와 동일한 수준에서 CXL 관련 기술 개발을 선도하게 되었다고 언급하였습니다.
원문: ... have joined the ranks of Meta Platforms (Facebook), with its Transparent Page Placement protocol and Chameleon memory tracking, and Microsoft with its zNUMA memory project ...
더넥스트플랫폼 기사 원문은 아래 링크를 통해 확인하실 수 있습니다.
더넥스트플랫폼[링크]
파네시아, SSD 기반의 메모리 확장 기술, 'CXL-SSD' 개발
Panmnesia KAIST June 20, 2022

파네시아는 CXL(Compute Express Link) 기술을 활용하여 SSD를 일반적인 시스템 메모리처럼 활용하는 기술, CXL-SSD를 개발하였습니다. 해당 기술은 올해 6월 열리는 ACM HotStorage 학회에서 발표될 예정입니다.

CXL-SSD의 개요
CXL은 다양한 프로세서, 가속기, 메모리 장치를 캐시 일관성을 보장하는 형태로 연결하는 인터커넥트 프로토콜로, CXL.io, CXL.cache, CXL.mem, 세 가지 서브프로토콜을 포함하고 있습니다. 파네시아는 CXL 프로토콜이, SSD와 같은 블락 스토리지 장치를 일반적인 시스템 메모리처럼 활용하는데 쓰일 수 있다고 생각하였습니다. 이에 '어떻게 하면 SSD를 메모리처럼 노출시킬 수 있을지', 'SSD를 메모리처럼 노출시켰을 때 발생 가능한 문제는 무엇인지', '이 때 발생한 문제는 어떻게 해결할 수 있을지' 탐구하였으며, 관련 내용을 논문 형태로 공개하였습니다. 각각에 대해 탐구한 내용을 간단히 요약하면 다음과 같습니다.
어떻게 하면 SSD를 메모리처럼 노출시킬 수 있는가?
파네시아는 우선 SSD를 CXL 장치(CXL-SSD)로 활용함으로써, 기존의 블락(수백 혹은 수천 바이트) 단위가 아닌 바이트 단위로 접근할 수 있도록 만들었습니다. 또한, CXL의 세 가지 서브프로토콜 중 CXL.cache 프로토콜을 활용할 경우, CXL-SSD 장치의 성능이 저하될 수 있다는 것을 발견하였습니다. 다수의 CXL-SSD 장치와 다수의 호스트(CPU)가 있을 때, 어떤 식으로 CXL-SSD의 메모리 공간을 호스트에게 할당하는 것이 합리적인지에 대해서도 탐구하였습니다.
SSD를 메모리처럼 노출시켰을 때 발생 가능한 문제는 무엇인가?
파네시아는 CXL-SSD를 메모리처럼 활용할 경우, SSD의 내부 동작으로 인해 예상치 못한 지연이 발생할 수 있음을 발견하였습니다. 예를 들어, SSD에서 용량을 확보하기 위해 주기적으로 수행하는 가비지컬렉션(garbage collection) 동작이 진행되는 도중에 호스트가 SSD에 저장된 데이터를 로드(load)하는 명령을 보낼 경우, 호스트가 예상치 못한 지연이 발생할 수 있습니다.
이 때 발생한 문제는 어떻게 해결할 수 있는가?
앞서 언급한 '예상치 못한 지연'을 방지하기 위해, 파네시아는 호스트 측에서 CXL-SSD에게 일종의 힌트를 건네 주는 기법을 제안하였습니다. 예를 들어, 호스트가 판단하기에 긴급하게 처리되어야 하는 메모리 접근 명령이 있을 경우, 해당 명령을 보낼 때 '긴급하게 처리가 필요하다'는 힌트를 함께 보내면, CXL-SSD에서 내부 동작을 일시 중지하고 긴급한 명령부터 우선적으로 처리하도록 설계하였습니다.
해당 연구 내용은 해외 언론 테크타겟(TechTarget)에서, CXL-SSD 기술을 선도하는 연구 내용으로써, 삼성, 키옥시아 기술과 함께 소개되었습니다. 자세한 내용은 아래의 링크를 통해 확인할 수 있습니다.
CXL-SSD 대표사진
테크타겟[링크]
파네시아, 세계 최초 CXL 2.0 단대단 프로토타입 공개
Panmnesia KAIST April 30, 2022

파네시아는 CXL 2.0(Compute Express Link 2.0) 기반 차세대 메모리 확장 플랫폼 DirectCXL을 개발하였습니다. 파네시아는 또한 세계 최초로 운영체제가 실장된 단대단(End-to-end) CXL 2.0 프레임워크를 제작하여 공개하였습니다. 해당 기술은 올해 7월 미국 칼스배드(Carlsbad)에서 열리는 USENIX ATC 학회에서 발표될 예정입니다.

기존 메모리 확장 방식
오늘날 빅데이터 분석, 그래프 분석, 인메모리 데이터베이스 등 대규모 데이터에 기반한 응용처리가 증가함에 따라, 데이터센터에서는 이를 더 빠르고 효율적으로 처리하기 위해 시스템의 메모리 확장에 많은 투자를 하고 있습니다.
그러나 우리가 흔히 알고 있는 메모리 확장 방식인 더블 데이터 대역폭(DDR) 인터페이스를 통한 메모리 확장은 추가할 수 있는 메모리 개수의 제한이 있어, 대규모 데이터 기반의 응용을 처리하기에 충분하지 않습니다. 따라서 데이터센터에서는 CPU와 메모리로 이루어진 메모리 노드들을 따로 구성하고, 응용을 수행하는 호스트의 메모리가 부족하면 네트워크로 연결된 메모리 노드를 자신의 메모리 공간으로 사용하는 원격 데이터 전송 기술(RDMA) 기반의 메모리 확장을 사용합니다.
기존 메모리 확장 방식의 문제점
여러 메모리 노드를 사용하는 RDMA 기반의 메모리 확장을 통해 데이터센터는 시스템의 메모리 크기를 늘릴 수 있었지만, 여전히 해결해야 할 문제들이 남아있습니다. 우선 RDMA 기반 메모리 확장 시스템에서는 노드 간 데이터 이동 시 불필요한 데이터 복사, 소프트웨어의 개입 그리고 프로토콜 전환으로 인한 지연을 발생시켜 성능 저하가 발생합니다. 또한 시스템의 메모리 확장 시 메모리만을 추가할 수 있는 것이 아닌, 메모리와 메모리를 제어할 CPU가 하나의 메모리 노드를 이루어 시스템에 추가되어야 했기 때문에, 추가적인 비용 소모가 발생합니다.
CXL 기반 메모리 확장 방식
최근 CXL 프로토콜의 등장으로 많은 메모리 고객사와 제조사가 이러한 문제를 해결할 수 있는 가능성을 확인하고 있습니다. CXL은 PCIe 인터페이스 기반의 CPU-장치 간 연결을 위한 프로토콜로, 이를 기반으로 한 장치 연결은 기존보다 높은 성능과 확장성을 지원하는 것이 특징입니다.
국내외 유수 기업들이 모여 CXL 인터페이스 표준 규약을 제안하는 CXL 컨소시엄은 지난 2019년 CXL 1.0/1.1을 처음 제안하였고, 이후 CXL 2.0을 발표하며 CXL 1.0/1.1에서 하나의 포트당 하나의 지역 장치만을 연결할 수 있었던 확장성 문제를 스위치 네트워크를 통해 개선, 하나의 포트를 여러 포트로 확장할 수 있도록 했습니다. 따라서 CXL 1.0/1.1과 달리 CXL 2.0에서는 확장된 포트에 다수의 원격 장치를 연결하는 것이 가능해 더 높은 확장성을 지원할 수 있게 되었습니다.
그러나 CXL 2.0의 높은 확장성에도 불구하고, 아직 CXL 연구의 방향성을 제시해줄 수 있는 시제품 개발 및 연구들이 진행되지 않아, 메모리 업계와 학계에서는 여전히 CXL1.0/1.1을 기반으로 로컬 메모리 확장, 시제품 개발 및 연구를 진행하고 있는 실정입니다. 따라서 새로운 CXL 2.0을 통한 메모리 확장 연구의 방향성과 초석을 제시할 필요성이 커졌습니다.
DirectCXL: 세계 최초 CXL 2.0 단대단 프로토타입
파네시아가 전 세계 최초로 프로토타입한 CXL 2.0 기반 메모리 확장 플랫폼 ‘DirectCXL’은 높은 수준의 메모리 확장성을 제공하며, 빠른 속도로 대규모 데이터 처리를 가능케 합니다. 이를 위해 파네시아는 메모리를 확장해 줄 장치인 'CXL 메모리 장치'와 호스트 'CXL 프로세서 (CPU)', 여러 호스트를 다수의 CXL 메모리 장치에 연결해주는 'CXL 네트워크 스위치' 그리고 메모리 확장 플랫폼 전반을 제어할 'CXL 소프트웨어 모듈'을 개발하여 플랫폼을 구성하였습니다.
구성된 DirectCXL 플랫폼을 사용한 시스템에서는 확장된 메모리 공간에 직접 접근하여 데이터를 CPU의 캐시로 가져와 불필요한 메모리 복사와 소프트웨어의 개입이 없으며, PCIe 인터페이스만을 사용하여 프로토콜 전환을 없애 지연시간을 최대한 줄였습니다. 또한 추가적인 CPU가 필요 없는 CXL 메모리 장치를 CXL 스위치에 연결하는 것만으로 메모리 확장이 가능해 효율적인 시스템의 구성이 가능합니다. 국내외 소수 대기업에서 메모리 장치 일부 단품에 대한 구성을 보여준 준 사례는 있지만, CXL 2.0 기반, CPU부터 CXL 스위치, 메모리 장치가 장착된 시스템에서 운영체제를 동작시키고 데이터 센터향 응용을 실행하고 시연한 것은 이번 사례가 처음입니다.
파네시아는 자체 제작한 메모리 확장 플랫폼 DirectCXL의 성능을 검증하기 위해 4개의 호스트 컴퓨터가 CXL 네트워크 스위치를 통해 연결된 다수 CXL 메모리 장치들을 제어하는 환경을 구성하였습니다. 이후 구성된 플랫폼을 통해 CXL 메모리 장치의 성능을 기존 RDMA 기반 메모리 확장 솔루션과 비교하였습니다. 파네시아가 제안한 DirectCXL은 확장된 메모리에 대한 접근 시간 검증에서 기존 RDMA 기반의 메모리 확장 솔루션 대비 8.3배의 성능 향상을 보였으며, 많은 메모리 접근을 요구하는 그래프 응용처리 및 인 메모리 데이터베이스 응용처리에서도 각각 2.3배, 2배의 성능 향상을 이루어 냈습니다.
파네시아는 "이번에 개발된 DirectCXL은 기존 RDMA기반 메모리 확장 솔루션보다 훨씬 적은 비용으로도 뛰어난 성능과 높은 확장성을 제공하는 만큼 데이터센터나 고성능 컴퓨팅 시스템에서의 수요가 클 것으로 기대한다. 세계 최초로 개발된 CXL 2.0 기반의 단대단 프토타입 플랫폼을 활용하여 CXL이 적용된 새로운 운영체제(OS)는 물론 시제품 고도화를 통해 향후 CXL을 활용한 시스템 구축에 초석을 제공할 것이다ˮ라고 밝혔습니다.
해당 연구 내용은 다수의 기사를 통해 소개되었습니다. 관련 내용은 아래의 링크를 통해 확인할 수 있습니다.
전자신문 지면
세계일보 지면
이웃집과학자[링크]
디지털데일리[링크]
보안뉴스[링크]
세계일보[링크]
워크투데이[링크]
헬로디디[링크]
인공지능신문[링크]
충청일보[링크]
헤럴드경제[링크]
디지털타임스[링크]
테크월드[링크]
전자신문[링크]
한국강사신문[링크]
ZDNet[링크]
충청뉴스[링크]
신아일보[링크]
에너지경제[링크]
베리타스알파[링크]
아이뉴스24[링크]
파이낸셜뉴스[링크]
이뉴스투데이[링크]