르네 하스(Rene Haas) Arm CEO 키노트 “이제 모든 컴퓨터”_ Arm으로 구동된다 | 반도체네트워크

죄송합니다. 더 이상 지원되지 않는 웹 브라우저입니다.

반도체네트워크의 다양한 최신 기능을 사용하려면 이를 완전히 지원하는 최신 브라우저로 업그레이드 하셔야 합니다.
아래의 링크에서 브라우저를 업그레이드 하시기 바랍니다.

Internet Explorer 다운로드 | Chrome 다운로드

르네 하스(Rene Haas) Arm CEO 키노트 “이제 모든 컴퓨터”_ Arm으로 구동된다


PDF 다운로드



SR(Arm)-Rene-Haas2.jpg

Arm CEO 르네 하스(Rene Haas)는 컴퓨텍스 2023 키노트에서 “컴퓨팅의 황금기”가 Arm으로 구동되고 있음을 강조하며, 지금보다 더 흥미롭고 도전적인 시기가 없었던 이유를 아래와 같이 설명했다.  

“이제 모든 것이 컴퓨터”라는 말과 함께 컴퓨팅의 필요성은 업계의 상상 이상으로 증가했으며, 모든 애플리케이션, 디바이스 및 시장에 걸쳐 수요가 폭발적으로 증가하고 있다. 그러나, 이는 지구상의 한정된 자원 및 지속가능성에 맞추어 전력효율성을 갖춰야 한다. 이와 같은 컴퓨팅 수요의 증가는 AI의 등장으로 촉발되었는데, 이제 AI는 “업계가 이전에는 한 번도 보지 못한 컴퓨팅 리소스”를 필요로 한다.  

그러나 새로운 혁신은 엔지니어링에 신선한 도전 과제를 가지고 왔다. 이에, 시스템 온 칩(SoC) 설계가 더욱 어려워지고 있으며, 반도체 설계를 위한 더 많은 비용과 자원이 요구되고 있다. 이를 염두에 두고 Arm은 혁신적인 업계 트렌드를 채택하여 컴퓨팅 서브 시스템에 초점을 맞춰 이러한 복잡한 SoC 과제 해결을 지원한다.  

컴퓨팅 서브 시스템은 Arm의 기술을 통합하고, 특정 컴퓨팅 요구사항에 맞게 구성한 다음, 관련 프로세스 노드를 대상으로 유효성을 검증한다. 이로써 Arm의 파트너사들이 더 빠르게 실리콘에 보다 많은 성능과 컴퓨팅을 제공할 수 있게 된다.  

현재 Arm 기반의 컴퓨팅 서브 시스템의 예로 NVIDIA Grace CPU Superchip이 있다. 두 개의 72-core Arm Neoverse V2 컴퓨팅 서브 시스템을 탑재한 이 칩은 AI의 가장 까다로운 작업에서 10배의 성능 향상을 제공하는 동시에 와트당 성능을 크게 향상시킨다.  

AI는 현재 엔드포인트에서 폭발적으로 증가하고 있으며, 여기에 큰 기회가 있다. Arm의 강력하고 효율적인 컴퓨팅 플랫폼이 다양한 AI 워크로드를 지원하는 다양한 엔드포인트 사례로 Google Pixel 7 스마트폰의 라이브 캡션과 가상 어시스턴트, Amazon Echo의 음성 어시스턴트, 한국의 지능형 교통 모니터링과 Beewise의 자율주행 모니터링이 있으며, 이들은 “세상을 이롭게 하는” AI의 예시를 잘 보여주고 있다. 

소프트웨어 에코시스팀과 개발자의 역할, 그리고 “소프트웨어와 개발자 커뮤니티로 귀결되는” IP의 가치와 힘은 매우 중요하다. 지구상의 어떤 소프트웨어 에코시스템도 전 세계 1,500만 명의 개발자를 보유한 Arm과 대적할 수 없다. 이제 모든 것이 컴퓨터가 되었지만 이러한 컴퓨터를 만드는 일은 점점 더 어려워지고 있다. 여기에 AI가 더해지면서 엔지니어링 과제의 규모는 더욱 복잡해지고 있다. 

Arm의 기술, 소프트웨어 에코시스템 및 파트너사의 강점 덕분에 기술의 미래가 그 어느 때보다 밝아지고 있다. 이미 여러 기술 시장에서 다양한 컴퓨팅 및 AI 워크로드가 Arm 컴퓨팅 플랫폼에서 실행되고 있다. 컴퓨팅의 미래는 Arm을 기반으로 설계되고 있다. 



[Arm의 크리스 버기(Chris Bergey) 인터뷰] Arm이 가지고 있는 영향력은 “이것”

글/배인순 프리랜서(mica68@naver.com)

SR(Arm)-Chris-Bergey2.jpg

COMPUTEX TAIPEI 2023 전시회 기간에 앞서 Arm의 크리스 버기(Chris Bergey) 클라이언트 사업부 수석 부사장 겸 총괄 매니저를 만났다. 본 인터뷰 내용은 그와 대화한 내용을 토대로 Arm이 가지고 있는 영향력에 대해 작성한 것이다. 이 자리에는 크리스 버기 부사장외 스테판 로싱거(Stefan Rosinger)-CPU 프로덕트 시니어디렉터, 앤디 크레이건(Andy Craigen)-클라이언트 사업부 매니지먼트 디렉터가 동석했다.


이번 행사를 컴퓨텍스 2023 전시회 기간에 준비한 이유는?

이번 행사 기획은 본인이 제안하였고 이번 컴퓨텍스 전시회 기간에 맞춰 행사를 준비할 것은 아시아 시장의 중요성이 크게 작용하였다. 아시아 시장의 경우 스마트폰, 핸드셋 단말기, 모바일 관련의 혁신들이 일어나고 있으며 한국의 삼성, 대만의 NDK, 미디어텍과 중국의 신생브랜드들도 많이 생겨나고 있다. 스마트폰 및 반도체 생태계의 성장과 아시아 시장의 차세대 기술 성장의 영향력을 보고 이번 대만 컴퓨텍스 전시회 기간에 행사를 하는 것이 적합하다고 생각하게 되었다. 더불어 차세대 기술의 성장에 있어 Arm이 가지고 있는 영향력을 보여주고 데모를 하는데 있어 적합한 지역이라고 생각했다.

신제품(TCS23)에 대해 간략하게 소개하면?

TCS23에는 궁극의 시각적 경험을 위한 새로운 5세대 GPU 아키텍처 기반의 최신 Immortalis GPU, 차세대 인공지능(AI)을 위한 Arm 성능 리더십을 이어가는 최신 Armv9 CPU 클러스터, 수백만 명의 Arm 개발자에게 더 쉽게 접근 가능한 소프트웨어를 제공하기 위한 새로운 개선 사항이 포함되어 있다. Arm은 실리콘에서 소프트웨어에 이르기까지, 모바일 혁신을 제공하여 방대한 글로벌 에코시스템이 구현하는 점점 더 몰입적인 디지털 경험을 실현할 수 있도록 지원하고 있으며, 모바일의 미래는 Arm에서 설계될 것이다.


앞에 말씀하신 제품에 대한 장점은?

전체적인 시장을 봤을 때 차세대 SoC를 개발한다는 자체가 무척 어려워지고 있고 비용도 많이 소요되므로 그 수요를 맞추는 것 또한 큰 도전이며 힘든 일이다. 예를 들어 3나노에서 2나노로 가는 것 또한 쉽지 않은 일이지만 그것 또한 우리에게는 도전 과제이며 기회라고 생각하고 있다. 이러한 상황에서 Arm이 활용할 수 있는 강점은 CPU, GPU를 설계하는데 있어 Arm 만이 가지고 있는 전문지식과 프로세스 레벨까지 트랜짓 할 수 있는 강점을 활용할 수 있도록 파트너들을 도와 주는 역할을 하고 프로세스 보조기술까지 잘 활용하여 더 나은 제품을 만들기 위해 노력하고 있다.


오늘 Arm CEO의 키노트에서도 AI기술에 대한 많은 언급이 있었고, 요즘 모든 제품에 AI가 적용되고 있다. 요즘 이슈가 되고 있는 AI 기술에서 Arm이 가지고 있는 장점은 무엇이며 다른 업체와의 차별 전략은 무엇인가?

보통은 AI를 단순한 컴퓨팅 기술정도로 생각할 수 있지만 여러가지 다른 유형의 컴퓨팅 기술들이 존재한다. 모든 제품을 구동하는데 어플리케이션도 중요한 역할을 하지만 그보다 중요한 것은 파워이다. 파워의 공급 방법에 따라 프로세싱도 달라질 수 있기 때문이다. AI를 프로세싱 하는데 있어서 한가지만으로 되는 것이 아니고 고객의 요구에 따라 처리 방식이 필요할 수도 있다. 이런 환경에서 AI가 구동하는데 CPU와 가속기가 필요한데 GPU 또한 하나의 가속기라고 볼 수 있으며 Arm의 리소스라는 MPU 또한 하나의 가속기라고 볼 수 있다. 하나의 설계가 아닌 광범위한 기술이나 IP설계가 필요하고 AI 관련해서는 Arm의 고효율의 기술 강점을 살려서 그 부분에 중점을 두고 개발하고 있다.

엔비디아, 인텔, AMD를 경쟁자라고 생각하기 보다는 이 업체들이 Arm의 IP 기술을 활용하여 핵심 디자인 형식으로 가는 경우 강력한 성능과 효율적인 제품들을 만들 수 있으므로 Arm 입장에서도 많은 시너지를 낼 수 있다고 생각한다.


자동차 분야가 급성장을 하고 있고 자율주행에 꼭 필요한 AI기술과 더불어 CPU, GPU기술도 중요하게 인식되는데 이 분야에서 Arm이 제공하는 기술 전략은 무엇인가?

자동차 시장은 기술 측면에서도 매우 복잡한 시장이다. 전기차가 아닌 기존의 내연차 경우도 각각의 부품마다 컴퓨팅의 종류가 다른데 전기차의 경우 각각 다른 형식의 컴퓨팅 방식이 필요하지만 기존의 차와는 다른 클로스터 형태로 통합할 수 있기 때문에 먼저 통합 방식으로 컴퓨팅을 하는 추세이다. 자율주행의 경우 레벨2의 경우 지능형 크로스컨트롤인 반면 핸들이 필요 없이 자율주행이 가능한 레벨5의 경우는 고성능의 컴퓨팅이 필요하다. 그렇지만 무엇보다 운전자의 안전이 가장 중요하다고 본다.  Arm이 기능적인 측면에서 안전을 보장할 수 있는 강점을 가지고 있기 때문에 CPU, GPU 측면에서 자율주행차의 생태계에서 보안 관련된 기능적인 모든 것들을 우리는 제공할 수 있다.


앞으로 출시를 앞두고 있는 제품은 주로 어떤 제품군에 포커스를 맞추고 있는가?

클라이언트 측면에서 보면 스마트폰, AR, VR, 특히 XR은 확장부문이 가능하고 잠재력이 커서 투자측면에서도 관심을 기울이고 있다.  X86을 대체하는 폼펙터로서 Arm 베이스의 랩탑, WOA(웹 지향 아키텍처), 크롬북에도 많은 관심을 가지고 있으며 투자도 집중적으로 추진하고 있다. 요즘 스트리밍 서비스를 통해 TV를 통한 소비가 늘어나고 초대형 화면을 통한 게임 등 소통이 이뤄지고 있기 때문에 디지털TV에 적합한 Arm 베이스 기반의 IP들이 장착될 수 있어 가전시장도 주목하고 있다.

Arm 제품군 전체로 보았을 때 고객시장은 4가지로 분류 된다. 첫번째는 클라이언트, 두번째는 자동차, 세번째는 데이터센터와 통신분야까지 진출할 계획이다. 마지막으로 IoT 분야는 예전부터 관심과 노력을 기울이고 있는 분야로서 IoT 디바이스가 네트워크와 인터랙션 하는데 필요한 Arm의 역할이 있는데 그 중에서 보안, 소프트웨어 관련된 아키텍처 개발에 집중하고 있다.


Arm 기술에 대한 미래 투자방향은? 

앞서 말한 4가지는 고객 시장에 대한 분류이다. 개발 방향은 사실 애매한 부분인데 한가지 시장을 대상으로 IP를 설계하고 또 일부를 수정하여 다른 시장에도 적용할 수 있는 방식을 이용하면 시너지 효과를 기대할 수 있다고 본다.

Arm이 개발자나 대학의 미래 엔지니어들을 대상으로 하는 교육프로그램이 있는지?

전체적으로 각 지역에서 교육을 담당하는 그룹이 있고 외부 파트너사와 협업하여 교육을 진행하고 있는데 정부기관, 대학, 고등학교에서도 프로그램이 제공되고 있다. 개발자들을 위한 웹사이트가(https://developer.arm.com) 운영되고 있어 다양한 프로그램을 통해서도 트레닝을 받을 수 있다.


마지막으로 Arm의 향후 제품 로드맵은?

우리가 지금까지 추진해온 로드맵 방향은 크게 변하지 않을 것이다. 우리가 가장 중점을 두고 있는 것은 제품의 성능개선에 대해 노력하고 파운드리와의 협업을 통해 효율적인 프로세서 작업을 하는 것이다. 또한 개발자들과 긴밀한 관계를 유지하면서 Arm 제품을 보완하고 발전방향에 대해 늘 고민하고 개선해 나가는 것이 우리의 방향이다. 



CPU 성능을 선도하는 Arm Cortex-X4

글/사우라브 프라단(Saurabh Pradhan), CPU 프로덕트 매니지먼트 디렉터

SR(Arm1)-0(CUP).jpg

지난 4년 동안 Arm은 최고의 CPU 성능, 효율성을 제공하기 위해 끊임없이 노력해 왔다. 그 시작은 Arm Cortex-X1으로, 이는 Arm의 첫 번째 고성능 Cortex-X CPU이다. 이후, Armv9 아키텍처에 기반한 Arm Cortex-X2 및 Cortex-X3 CPU는 두 자릿수의 IPC 성능 향상을 가져왔다. 모든 Cortex-X CPU는 Arm의 Cortex-X Custom 프로그램의 일환으로써, 이 프로그램은 성능 최우선 설계를 생성하고, 다양한 시장 요건을 충족한 맞춤화 기능을 제공하며, Arm 에코시스템의 기능을 확장한다.

Arm은 2세대 및 3세대 Cortex-X CPU와 함께 고성능 Cortex-X CPU 코어와 고효율 프리미엄 성능의 Cortex-A700 CPU 시리즈 및 고효율 Cortex-A500 CPU 시리즈가 결합된 2세대 Armv9 CPU 클러스터를 도입했다. 이러한 클러스터는 업계 최고의 유연성과 함께 최고 수준의 성능 및 효율성을 제공한다. 다양한 CPU 클러스터는 Arm 에코시스템을 풍부하게 하여 디지털 생활을 변화시키는 신기술 및 경험을 제공할 수 있다.

이제 최신 Cortex-X CPU인 Arm Cortex-X4와 함께 Cortex-X4와 신형 Cortex-A720, A520 CPU를 결합한 신형 CPU 클러스터를 출시하게 되어 매우 기쁘게 생각한다. Cortex-X4를 통해 최고의 성능을 발휘하는 Arm Cortex CPU를 제공할 뿐만 아니라, 현재까지 구축된 가장 강력한 Cortex CPU 컴퓨팅 클러스터를 도입하고 있다. 클러스터의 백본은 새 DynamIQ Shared Unit인 DSU-120으로, 이는 확장성 및 PPA 전반에 걸쳐 향상된 기능과 새로운 기능을 갖춘 DSU-110을 기반으로 한다. 이 모든 것은 최신 Armv9.2 아키텍처를 기반으로 하며, 이와 같이 CPU 아키텍처 분야에서 Arm은 선도적인 역할을 이어가고 있다.

SR(Arm1)-2(CUP).jpg

Cortex-X4: 성능 효율성 재정의

모든 Cortex-X CPU와 마찬가지로 Cortex-X4는 최고의 성능을 목적으로 설계되었으며, 지난해 안드로이드 플래그십에 비해 15% 향상된 성능으로 다시 한번 두 자릿수의 IPC 성장에 기여하였다. IPC가 두 자릿수로 증가함으로써 애플리케이션 실행, 웹 브라우징, 페이지 로딩 및 렌더링, 스마트폰의 카메라 기능 등 단일 스레드 ‘버스트’ 워크로드에 최고의 성능을 제공할 수 있다. 이러한 동급 최고 성능의 배경에는 프론트엔드 마이크로아키텍처 명령 대역폭의 한 단계 증가가 있다. Cortex-X4는 성능뿐 아니라, 전력 효율성이 40% 향상된 역대 최고 효율의 Cortex-X CPU 코어이다. 이러한 성능, 효율성 장점과 함께 확장성 확대 기능이 제공되며, 각 코어당 최대 2MB의 L2 캐시를 통해 다양한 소비자 디바이스를 대상으로 하고 있다.


개선된 신형 DSU(DynamIQ Shared Unit)

신형 DSU-120은 2년 전 출시된 DSU-110을 기반으로 하며, DynamIQ Shared Unit의 모든 측면에서 개선된 기능을 제공한다. 보급형 스마트폰, 웨어러블부터 플래그십 스마트폰, 프리미엄 랩탑에 이르는 다양한 소비자 디바이스용 CPU 클러스터를 대상으로 하여 싱글 코어부터 최대 14코어까지의 확장성을 제공한다. DSU-120은 새로운 지능형 절전 모드와 같은 고급 기능을 제공하여 CPU 클러스터 전반의 효율성을 개선한다. 이러한 혁신적인 효율성은 CPU 클러스터가 어떤 소비자 디바이스를 대상으로 사용되든 그 사용 일수를 증가시킬 수 있다. DSU-120은 24MB 및 32MB의 대용량 L3 캐시 구성 옵션도 추가, 제공한다. 이와 같이 클러스터 성능 향상, 시스템 전력 감소로 클러스터의 기능을 확장할 수 있다.

SR(Arm1)-3(CUP).jpg

역대 최강의 클러스터

최대 14개의 코어와 대용량 L3 캐시를 갖춘 새 DSU-120은 역대 최강, 최고 성능의 CPU 클러스터를 구현한다. 고성능 랩탑용 10x Cortex-X4, 4x Cortex-A720 CPU 클러스터부터, 플래그십 스마트폰용 1x Cortex-X4, 4x Cortex-A720 및 4x Cortex-A520 클러스터에 이르기까지, 확장성이 뛰어난 DSU는 Arm의 새로운 토탈 컴퓨트 솔루션(TCS23)의 핵심 요소다. Arm은 또한 1x Cortex-X4, 5x Cortex-A720 및 2x Cortex-A520으로 구성된 8 코어 CPU 클러스터도 제공하고 있다. 이러한 CPU 클러스터를 바탕으로 파트너사들은 차세대 소비자 디바이스를 자체 혁신할 수 있다. 다양한 사용 사례와 자체 컴퓨팅 요구 사항에 따라 개발, 활용할 수 있다. 



Arm GPU, 비주얼 컴퓨팅 재정의

글/댄 윌슨(Dan Wilson), GPU 프로덕트 매니지먼트 디렉터

SR(Arm2)-0(신형).jpg

5세대 GPU 아키텍처 소개

5 세대 아키텍처는 Arm의 미래 GPU의 기반이 되어 세계가 비주얼 컴퓨팅의 새로운 시대를 맞이하는 순간에 판도를 바꿔놓을 그래픽 기능을 지원할 것이다. 5 세대는 첫 해에 장면 복잡성, 향상된 그래픽, 메모리 시스템 전력이라는 세 가지 주요 처리 트렌드를 목표로 삼았다.

SR(Arm2)-3(신형).jpg

(1) 장면 복잡성

개발자가 더 나은 품질의 비주얼 구현에 노력하면서 모바일에서 장면 복잡성은 폭발적으로 증가하고 있다. 이 경우, 장면 복잡성이 증가할수록 지오메트리 관련 메모리 접근이 가용 대역폭을 초과하여 성능에 영향을 미칠 수 있는 문제가 발생한다. 5세대의 그래픽 파이프라인을 개선함으로써 사용자는 좋아하는 게임을 고속 프레임 속도(FPS)로 실행할 수 있게 될 것이다. 또한, 차세대 고도 기하학 게임과 실시간 3D 애플리케이션을 모바일에서 구현할 수 있게 해준다.

이러한 복잡한 장면을 관리하기 위해 그래픽 파이프라인 작업은 DVS(Deferred Vertex Shading) 파이프라인을 우선적으로 도입하며, 이 파이프라인은 Arm GPU의 지오메트리 데이터 플로우를 혁신적으로 개선한다. DVS를 통해 더 큰 코어 수로 성능을 확장할 수 있으므로 이를 통해 Arm의 파트너사들은 미래에 더 우수한 성능을 구현할 수 있다. 또한, DVS는 가장 복잡한 게임 장면에서 프레임 속도를 일정하게 유지하며 동시에 차세대 지오메트리 콘텐츠를 위한 미래 지향적 기능을 지원한다.

이미 DVS 도입으로 Elven Ruin에서 41%, 원신(Genshin Impact)에서 33%, 포트나이트(Fortnite)에서 26%의 대역폭 사용량 감소 등 다양한 인기 게임 콘텐츠의 여러 장면에서 성능 향상이 확인되고 있다. 이러한 아키텍처 혁신을 통해 PC 및 콘솔에서 흔히 볼 수 있는 더 유연한 게임 플레이와 보다 생동감 있고 현실적인 게임 경험이 모바일에서도 제공된다. 게임 애플리케이션뿐만 아니라 DVS는 건축가들을 위한 주요 CAD 애플리케이션에서도 대역폭을 37% 더 적게 사용하며, 이를 통해 건물용 CAD 도면을 실시간 3D 뷰를 통해 디지털 현실로 변환한다.

SR(Arm2)-4(신형).jpg

(2) 향상된 그래픽

개발자가 애플리케이션을 통해 더욱 훌륭한 비주얼을 제작함에 따라 하이 다이내믹 레인지(HDR) 렌더링의 사용이 증가하고 있다. HDR 렌더링은 Arm이 적극 지원하는 개발자 트렌드이며, 보다 우수한 비주얼이 가능하도록 이 기능의 성능을 개선했다. Immortalis-G720는 HDR 렌더링에서 사용되는 하이 뎁스(high-depth)의 텍스처 성능 영향 관리를 지원한다. DVS의 도입으로 인해 매우 복잡한 지오메트리 장면도 처리 여유를 제공하여 렌더링 될 수 있게 되었다. Arm 기술자들이 2023 게임 개발자 콘퍼런스(GDC)를 위해 준비한 데모를 통해, 5세대 기반의 Immortalis-G720은 Valhall 기반의 Immortalis-G715와 비교하여 WRITE 대역폭에서 31%, FPS 에서 약 20% 개선되었음이 확인되었다. 이에 따라, 그래픽 파이프라인에는 실시간 동적 조명, 블룸 효과 및 초점 뎁스 등 PC 품질의 효과를 추가할 수 있다.


(3) 메모리 시스템 전력

메모리 시스템 전력이 프로세서의 열 문제에 미치는 영향은 더욱 증가하고 있다. 지난해 Arm 토탈 컴퓨트 솔루션(TCS22)을 돌아보면 DRAM, 인터커넥트 및 메모리 전체에서 상당량의 메모리 시스템 전력 사용이 확인되었다. Arm은 5 세대를 통해 전력의 상당 부분을 GPU에 할당하여 더 우수한 비주얼 효과를 제공하고 추가적인 전력 절약을 통해 배터리 수명을 연장하고자 한다.

Arm GPU 

5 세대 아키텍처의 도입과 함께 Immortalis 및 Mali GPU의 설계 전반에 걸쳐 성능과 효율성이 대폭 향상되었다. Immortalis-G720 은 10개 이상의 코어를 지원하며, 최적화된 물리적 IP를 사용하여 SoC 디자인 가속화를 지원한다. Mali-G720 및 Mali-G620 는 독보적인 확장성으로 스마트폰, 노트북, 디지털 TV, 셋톱 박스(STB) 및 웨어러블 기기 등 다양한 소비자 다바이스에 프리미엄 그래픽 기능을 제공한다. Mali-G720 은 6~9 개의 코어를 지원하고, Mali-G620 은 5개 이하의 코어를 지원함으로써 Arm의 프리미엄 라이센스 고객은 해당 시장에 적합하게 디자인 작업을 신속히 재활용할 수 있다.

SR(Arm2)-5(신형).jpg
Arm은 GPU 전력 소비를 줄이기 위한 다양한 개선 사항을 제공하고 있으며, 최종 사용자는 이동 중에도 보다 장시간 업무와 게임을 즐길 수 있다. 각 Immortalis 및 Mali GPU는 역대 최고 수준의 에너지 효율성을 제공하며, 이전 세대보다 평균 15% 우수한 에너지 효율성을 제공한다. 즉, 성능/와트 비가 발전함에 따라 성능은 지속적으로 향상되고 있다. 또한, 메모리 대역폭 사용량이 최대 40% 감소하고 CPU 부하가 감소하는 등 시스템 수준의 효율성이 대폭 향상되었다. 이는 새로운 GPU 명령어 추가와 드라이버 최적화에 기인한다.

최신 GPU는 성능 면에서 최고 수준을 제공하며, 평균 15%의 최고 성능 향상을 보여준다. 또한, 하이 다이나믹 레인지 텍스처의 향상을 위해 64bpp 텍스처링의 용도로 아키텍처 처리량을 배가하고 있다.

Arm은 모든 GPU에 VRS를 위해 더 높은 성능의 쉐이딩 속도를 제공한다. 이 기능은 작년 Arm GPU에 도입되었다. 개발자 측면에서는 4x2 및 4x4 쉐이딩 속도의 성능이 향상되었다. VRS는 복잡한 쉐이딩으로 인한 높은 쉐이딩 비용을 줄임으로써 중요 부분에 고품질 그래픽이 전달되도록 한다.

Arm은 VRS 기능 개선과 함께 최적화된 2x MSAA (Multi-Sampling Anti-Aliasing)를 활성화함으로써 유연한 개발자 경험을 보장한다. 이로써 2x MSAA를 원하는 개발자가 4x MSAA로 업그레이드해야 할 필요가 없어졌다. 2x MSAA를 요하는 애플리케이션의 경우, 4x MSAA에 비해 7% 성능 향상이 이루어졌다. 새로운 GPU는 또한 Vulkan 동적 버퍼에 대한 향상된 지원을 제공한다. 



TCS23: 모바일 컴퓨팅을 위한 완벽한 플랫폼

글/ 킨잘 데이브(Kinjal Dave), 솔루션 매니지먼트 시니어 디렉터

SR(Arm3)-0(신형).jpg

Arm의 토탈 컴퓨트 솔루션(Total Compute Solution)은 2021년에 처음 출시된 이후로 최신 IP의 통합 패키지를 제공하여 원활한 작업을 할 수 있도록 설계 및 최적화되었다. 시스템 온 칩(SoC) 설계자들이 자체 컴퓨팅 서브시스템을 보다 쉽게 구축, 구성할 수 있도록 문제해결을 도와주며 이는 상호연결 SLCs 및 MMU을 위한 서드 파티 시스템 IP 개발 및 CPU와 GPU 클러스터와 통합하는 과정을 모두 포함한다. Arm의 토탈 컴퓨트 솔루션은 SoC 설계의 복잡성을 대폭 줄임으로써 엔지니어링 비용과 리소스를 절감하고 출시 기간을 단축시킨다.

이를 통해 디바이스 제조업체는 하드웨어 및 소프트웨어 차별화에 주력하여 실질적 상업적 가치를 제공할 수 있다. 이전 세대 제품들과 마찬가지로, Arm의 최신 토탈 컴퓨트 솔루션(TCS23)은 이러한 핵심 SoC 엔지니어링 해결 과제뿐만 아니라, 보다 포괄적인 모바일 컴퓨팅 트렌드에 대응하고 있으며, 이는 더욱 복잡한 사용자 경험 요구, 소프트웨어 신기능 그리고 성능 및 효율성을 위한 지속적인 업그레이드를 포함한다. 이러한 해결과제는 특히 실리콘 공급업체의 SoC 구축이 점점 더 복잡해지고 있는 프리미엄 모바일 시장과 관련이 있다. 최신 Armv9.2 아키텍처를 기반으로 구축된 TCS23을 통해 파트너들은 최고의 프리미엄 모바일 SoC 구축을 위한 전력 효율성 및 성능 한계의 극대화에 요구되는 최신 기술을 활용할 수 있다. 또한 파트너들은 다양한 구성과 확장형 컴퓨팅 솔루션을 개발하여 다양한 소비자 시장 부문에 TCS23 기능을 제공할 수 있다.

TCS23은 CPU, GPU 및 시스템 IP 전반에 걸쳐 최신 Arm IP 제품을 통합하여 차세대 모바일 디바이스를 위한 다양한 컴퓨팅 기능과 사용 사례를 제공한다. 이는 다음을 포함한다:

• 새로운 5세대 GPU 아키텍처 기반의 Arm 최고 성능 및 에너지 효율의 GPU인 Immortalis-G720, Mali- G720, Mali-G620

• 최신 Cortex-X4, Cortex-A720, Cortex-A520 및 두 자릿수의 성능, 전력 효율성 향상을 제공하는 최신 DynamIQ Shared Unit인 DSU-120으로 구성된 Armv9.2 컴퓨팅 클러스터

모든 최신 IP는 TCS23 플랫폼 전반에 걸쳐 확장성과 효율성 개선을 위해 시스템 차원의 최적화를 지원한다. TCS23은 최신 IP와 함께 최신 안드로이드 운영 체제에 맞는 개발 툴, 설계 및 최적화, 물리적 구현을 제공하여 SoC 설계의 가속화를 지원한다.

SR(Arm3)-1(신형).jpg
Arm은 개발자가 Armv9 아키텍처에서 머신 러닝(ML) 워크로드의 실행을 최적화할 수 있도록 Arm NN 및 Arm 컴퓨팅 라이브러리 등의 소프트웨어 라이브러리를 지속적으로 개발하고 있다. Arm NN과 Arm 컴퓨팅 라이브러리는 올 초부터 이미 1억 명 이상의 활성 사용자가 있는 안드로이드 구글 앱에서 사용되고 있다. Arm은 또한 업스트림 안드로이드 커널에 Arm IP와 신기능이 원활하게 접목될 수 있도록 노력하고 있다.

SR(Arm3)-2(신형).jpg
또한, TCS23을 통한 다양한 무료 툴 및 리소스 제공으로 개발자가 Arm 기반 모바일 디바이스에서 애플리케이션을 최적화할 수 있도록 지원한다. 전 세계적으로 모바일 개발자는 거의 9백만 명에 달하며, Arm은 Arm에서, Arm을 위한 보다 쉽고, 간단하며, 안전하고, 신속한 소프트웨어를 개발할 수 있도록 하는 유연성과 공통성을 제공한다는 자부심을 가지고 있다. 게이밍을 중심으로 Arm은 주요 게임 엔진들과 깊은 협력관계를 유지하여 그래픽 도구가 우수한 확장성의 게임 최적화가 가능하도록 보장하고 있으며, 또한 Arm의 상세 리소스들은 개발자들이 자체 게임 콘텐츠를 만들 수 있도록 지원한다.

마지막으로, 최적화된 물리적 IP는 최신의 최첨단 노드에서 Arm IP의 선도적인 구현을 실현한다.

SR(Arm3)-3(신형).jpg

TSC23 - 프리미엄, 성능 및 효율성

TCS23은 다양한 디바이스, 사용 사례, 컴퓨팅 요구사항에 따라 프리미엄, 성능, 효율성이라는 세 가지 유형으로 구성된다.


(1) 프리미엄

프리미엄 TCS23은 프리미엄 및 플래그십 스마트폰과 노트북에 일반적으로 요구되는 최고의 성능과 컴퓨팅 집약적 경험을 제공하도록 설계되었다. 이를 통해 몰입감 있고 원활한 AAA 모바일 게이밍 경험, 이미지 및 비디오 향상과 같은 첨단 AI 사용 사례, 그리고 디바이스의 다중 작업 등 최고의 시각적 경험에 필요한 통합 시스템 성능 및 효율성 향상을 추구한다. 프리미엄 TCS23은 수일간 사용할 수 있는 높은 수준의 전력 효율성과 함께 이 성능을 균형 있게 유지한다.


(2) 성능

성능 TCS23는 프리미엄 DTV 및 셋톱 박스(STB)와 미드 티어 스마트폰을 포함한 여러 소비자 디바이스 부문에서 다양한 컴퓨팅 요건을 충족할 수 있도록 설계되었다. 뛰어난 사용자 경험을 위한 최대 확장성과 함께 우수한 그래픽 및 컴퓨팅 성능을 제공하는 데 그 목적을 두고 있다. 강력한 그래픽 및 컴퓨팅 성능은 이러한 디바이스의 멀티태스킹 작업의 핵심 요소이며, 특히 애플리케이션을 실행, 전환할 때 매우 매끄러운 UX를 제공한다. 예를 들어 DTV의 경우, 화면에 비디오 스트리밍 및 AI 애플리케이션이 오버레이 되는 동안 비디오 통화와 같은 멀티뷰 기능이 가능하다. 향상된 성능을 통해 카메라 및 비디오 사용 사례에서 사용자 경험을 향상시키는 최첨단 머신 러닝(ML) 기능이 제공된다.


(3) 효율성

효율성 TCS23은 최고의 전력, 비용 및 면적 효율성을 위해 초고도의 확장성 솔루션을 제공한다. 이는 보급형 DTV 및 셋톱 박스(STB), 스마트 워치 등의 웨어러블 디바이스와 같이 효율성이 중요한 디바이스를 대상으로 한다. 파트너들은 Arm IP의 향상된 전력 및 시스템 레벨 효율성을 바탕으로 뛰어난 배터리 수명을 갖춘 차세대 제품을 설계할 수 있다. 또한, TCS23는 최신 Cortex-A520에 의해 구동되는 확장성 리틀(LITTLE) CPU 코어 클러스터 및 Mali GPU를 갖추어 비용에 민감한 시장을 대상으로 다양한 구성 옵션을 제공하고 있다. 



전체 소비자 디바이스 시장으로 Armv9 특장점 확대

글/매니시 판디(Manish Pandey), 수석 CPU 프로덕트 매니저

SR(Arm4)-0(전체).jpg

Arm CPU 클러스터에서 Cortex-A700 및 Cortex-A500 시리즈 CPU는 소비자 디바이스를 통한 사용자의 즐거운 경험에 중요한 역할을 수행한다. Cortex-A700 시리즈 CPU는 셋톱 박스(STB) 및 디지털 TV(DTV), 스마트워치 및 XR 웨어러블, 스마트폰 및 랩탑 등 다양한 응용 분야와 시장에서 사용되는 매우 성공적인 제품군이다. 클러스터의 ‘주력’ 역할을 하는 Cortex-A700 CPU는 제한된 전력 범위에서 고성능을 발휘한다. 한편, Cortex-A500 CPU는 최소한의 실리콘 풋프린트에서 최고의 에너지 및 전력 효율성을 제공한다.

올해는 기존 제품군에 두 신제품, 즉 Cortex-A720 및 Cortex-A520 CPU를 추가, 출시하게 되어 매우 기쁘게 생각한다. 두 제품 모두 새로운 Armv9.2 아키텍처를 기반으로 제작되었으며, 전체 계층의 소비자 디바이스에 걸쳐 Armv9 컴퓨팅 기능을 제공한다. 두 CPU를 새로운 DynamIQ Shared Unit, DSU-120에 통합하여 지능형 절전 기능, 향상된 PPA 그리고 더 큰 확장성을 제공할 수 있게 되었다. 이를 통해 Cortex-A720 및 Cortex-A520을 탑재한 CPU 클러스터는 고성능, 고효율성 그리고 우수한 확장성을 제공할 수 있다.

SR(Arm4)-1(전체).jpg

Cortex-A720: 업계 최고의 지속적인 프리미엄 성능

Cortex-A720은 지속적인 프리미엄 성능을 위한 업계 최고의 IP로, 이전 세대 Arm Cortex-A715에 비해 20% 향상된 전력 효율을 제공한다. 최신 마이크로 아키텍처 개선으로 전체 시스템 전력 및 성능을 활용할 수 있도록 최적화된 Cortex-A720은 최신 소비자 디바이스의 폼 팩터 및 열 제약 조건 내에서 더 우수한 성능과 더 긴 배터리 수명에 대한 요구에 부응하도록 설계되었다. 이를 통해 더 빠르고 더 장시간의 게임 플레이 그리고 제한 없는 창의성을 발휘할 수 있도록 지속적인 성능을 제공한다.

마이크로아키텍처의 개선과 최적화를 위해 디바이스 내에서의 지속적인 성능을 향상시키는 최신 프로세스 노드를 도입한다.

SR(Arm4)-3(전체).jpg
이러한 수준의 성능과 효율성은 프리미엄 소비자 디바이스 시장에만 국한되지 않다. Arm은 비용과 공간의 제약이 있는 소비자 디바이스의 모든 솔루션에 개선 사항이 적용될 수 있도록 하였다. Cortex-A720은 구현 시에 Arm Cortex-A78 의 면적 풋프린트에 맞게 구성할 수 있으며, 10% 더 우수한 성능, 더 높은 효율성 그리고 보안 및 머신 러닝(ML)을 위한 최신 Armv9.2 기능을 제공한다. Cortex-A720 의 이 새로운 면적 최적화 구성으로 Armv9 의 사용 사례 및 디바이스는 더욱 확대되어 그 범위를 특히 저가형 시장으로 확장한다.

SR(Arm4)-4(전체).jpg
또한, 새로운 DSU-120과의 호환성을 통해 Cortex- A720 은 Cortex-A520과 함께 big.LITTLE 클러스터에서 사용하여 메인스트림 모바일, DTV, STB 및 웨어러블 기기의 다양한 티어에 대응할 수 있다.


Cortex-A520: 최고의 전력 효율 설계

최신 LITTLE 코어인 Cortex-A520은 최소의 실리콘 풋프린트에서 최고의 전력 효율을 제공하는 것에 중점을 두어 이전 세대 Cortex-A510에 비해 22% 개선된 전력 효율을 제공한다. 이를 통해 소비자 디바이스의 배터리 수명 개선을 위해 저강도 백그라운드 작업에 필요한 컴퓨팅 전력을 줄이며 이와 같이 제한 없는 장시간의 사용자 경험을 제공할 수 있다. 2년 전 Cortex-A510에 도입된 병합 코어(Merged-core) 아키텍처를 기반으로 하는 이러한 고효율 개선은 특히 데이터 프리패치와 분기 예측을 중심으로 한 마이크로 아키텍처 수준의 추가 변경을 통해 가능해 졌다. Cortex-A520은 ‘효율성 우선’ 설계이지만, Cortex-A510 에 비해 최대 8% 향상된 성능을 제공한다.

SR(Arm4)-5(전체).jpg

Cortex-A520: 64비트 전용 및 고급 Armv9 보안 및 ML 기능

Cortex-A520 은 최초의 진정한 64비트 전용 Arm LITTLE CPU로 이미 시장에 64비트 전용 모바일 디바이스가 출시되어 있으며, 향후 더 많은 디바이스가 출시될 예정이다. 전 세계의 거의 모든 모바일 앱 스토어는 지난 1년간 64비트 지원을 의무화해 왔으며, 앱 생태계는 64비트 전용 디바이스를 위한 준비를 완료하였다.

64비트만 지원하므로 파트너들은 더 우수한 컴퓨팅 성능과 더 많은 보안 및 ML 기능을 제공하는 동시에 앱 개발 프로세스를 개선할 수 있게 되었다. 컴퓨팅 성능 측면에서 64비트 명령어 세트는 최대 20%의 성능 향상을 제공하여 앱 로딩 시간을 단축하고 더 빠르고 반응성이 뛰어난 사용자 환경을 제공한다.

이를 통해 다양한 작업부하, 특히 AI 및 AAA 게임에서 더 많은 컴퓨팅에 대한 끊임없는 수요를 충족할 수 있다.

오늘날 대부분의 안드로이드 모바일 디바이스는 64비트 및 32비트 안드로이드 런타임을 동시에 지원할 수 있는 OS 버전(버전 5.0 이상)을 배포한다. 하지만 이에 따라 추가 메모리, 개발 및 테스트 비용 발생이 불가피하다. 64비트 전용 모바일 디바이스로의 전환의 일환으로 64비트 앱 개발에 우선순위를 둠으로써 복잡성이 감소하고 개발 비용과 테스트 비용이 절감되며 출시 시간이 단축될 수 있다. 또한 32비트 아키텍처에서는 불가능했던 고급 성능과 견고성을 통해 안드로이드 에코시스템은 새로운 기능과 기술 지원에 집중할 수 있다.

SR(Arm4)-6(전체).jpg
64비트 아키텍처는 PAC(Pointer Authentication), BTI(Branch Target Identification) 및 MTE(Memory Tagging Extension)을 포함한 Armv9 기능을 통해 디바이스에 향상된 보안을 제공한다. 이러한 기능은 전체 위험 보안 버그의 대부분을 차지하는 메모리 안전 위반을 포함하여, 특정 클래스의 취약성을 최대 95% 제거한다. 또한 Arm은 Armv9.2 아키텍처를 통해 보안 성능을 지속적으로 개선하고 있다. 올해 도입된 신규 QARMA3 PAC 알고리즘은 LITTLE 코어의 경우 PAC의 오버헤드를 1% 이하로 줄였다. 

leekh@seminet.co.kr
(끝)
<저작권자(c) 반도체네트워크, 무단 전재-재배포 금지>

X


PDF 다운로드

개인정보보호법 제15조에 의한 수집/이용 동의 규정과 관련하여 아래와 같이 PDF 다운로드를 위한 개인정보 수집 및 이용에 동의하십니까? 동의를 거부할 수 있으며, 동의 거부 시 다운로드 하실 수 없습니다.

이메일을 입력하면,
(1) 신규참여자 : 성명/전화번호/회사명/분야를 입력할 수 있는 입력란이 나타납니다.
(2) 기참여자 : 이메일 입력만으로 다운로드가 가능합니다.

×

회원 정보 수정