매트랩을 활용한 데이터 과학과 머신러닝 응용 | 반도체네트워크

죄송합니다. 더 이상 지원되지 않는 웹 브라우저입니다.

반도체네트워크의 다양한 최신 기능을 사용하려면 이를 완전히 지원하는 최신 브라우저로 업그레이드 하셔야 합니다.
아래의 링크에서 브라우저를 업그레이드 하시기 바랍니다.

Internet Explorer 다운로드 | Chrome 다운로드

매트랩을 활용한 데이터 과학과 머신러닝 응용


PDF 다운로드



자료제공/매스웍스코리아
정리/심정현, Allison+Partners Korea


매스웍스코리아는 지난 18일(목) ‘매트랩을 활용한 데이터 과학과 머신러닝 응용’을 주제로 온라인 세미나를 개최했다. 많은 기업에서 빅데이터의 중요성이 증가하지만 낮은 기술 숙련도와 데이터 접근성·사일로 문제로 올바른 빅데이터를 수집·저장하고, 알고리즘 기반으로 처리하는 최적의 방법을 찾지 못하고 있다. 매스웍스는 본 세미나를 통해 간단한 함수를 이용하여 병렬 또는 분산 컴퓨팅 아키텍처에서 빅데이터를 고속 처리하고, 이를 통해 스트리밍, 이미지 분석 등의 애플리케이션을 원활하게 지원하는 방법을 소개했다. 이와 더불어, 머신러닝 워크플로우의 페인포인트와 이를 해결하는 매스웍스의 자동화된 머신러닝 개발 솔루션을 설명함으로써 도메인 데이터 또는 알고리즘에 대한 사전 지식과 경험이 없는 사용자도 고성능 머신러닝 시스템을 개발할 수 있는 자사 솔루션의 혜택을 강조했다.
매스웍스코리아 성호현 부장은 “매스웍스는 ‘빅데이터 처리’ 및 ‘데이터 특징 추출’ 과정을 간소화 및 자동화함으로써 기업 빅데이터 활용의 주된 도전과제로 지목되는 ‘숙련된 기술’ 및 ‘데이터 품질’ 문제를 해결한다”라고 강조했다.
매스웍스코리아 장규환 차장은 “머신러닝은 새로운 데이터 인풋으로 모델을 끊임없이 업데이트한다. 머신러닝 워크플로우 전반을 매우 간단하게 수행하도록 지원하는 경쟁력 높은 매스웍스 솔루션은 데이터 과학자와 엔지니어가 도메인 데이터 및 알고리즘에 대한 전문적인 지식 없이도 부담없이 최적의 데이터와 훈련 방법을 찾을 수 있다. AI에 대한 진입장벽을 낮추고, 다양한 혁신에 도전할 수 있게 한다”라고 말했다.

SR(Mathworks)-1.jpg

[매스웍스코리아가 지난 18일(목) 개최한 ‘매트랩을 활용한 데이터 과학과 머신러닝 응용’ 온라인 세미나에서 매스웍스코리아 성호현 부장이 머신러닝 도전과제를 해결하는 매트랩 솔루션에 대해 설명하고 있다.]

데이터 유형별 빅데이터 처리, 마이닝 및 생성

매트랩은 특정 산업 분야의 전문가와 엔지니어에게 사용 편의성 뛰어난 빅데이터 처리 환경을 제공한다. 빅데이터 처리 플랫폼의 메모리 용량보다 큰 규모의 빅데이터 처리에 적합한 톨(Tall) 함수를 통해 스트리밍 애플리케이션 지원을 위한 클러스터, 스파크(Spark)/하둡(Hadoop) 기반의 분산 데이터 처리를 지원한다. 또한, 고속 인메모리 연산이 장점인 분산(Distributed) 함수로 클러스터 기반 병렬 처리 방식을 통해 많은 양의 컴퓨팅 작업을 요하는 수학 및 행렬 연산을 원활하게 수행한다.
폭스바겐(Volkswagan)은 운전자 개별 맞춤형 자동차 기능 및 서비스를 제공하기 위한 기술적 기반을 구축하는 데 있어 매트랩을 도입함으로써, 주행 습관 데이터 기반의 개별 운전자 인식 알고리즘 개발에 성공했다. 

SR(Mathworks)-2.jpg 

[폭스바겐은 매트랩을 통해 운전자 인식 알고리즘을 개발했다.]

이미지 데이터 처리와 관련해서 매스웍스는 AI 개발 시간의 약 7~80%를 차지하는 대용량 영상·이미지 데이터 처리 및 특징 추출(Feature Extraction) 과정의 시간을 대폭 단축함으로써 이미지 처리와 관련한 AI 개발의 도전과제를 해결한다. 동영상 스트리밍 환경 구현, 대용량 이미지의 분할 처리, 병렬 컴퓨팅 및 GPU 지원, 픽셀 단위 분석, 물체 탐지 및 추적 등을 통해 의료, 국방 및 우주항공 등의 산업 분야에서 규모 및 복잡성이 점차 증가하고 있는 이미지 데이터의 처리를 가속화한다.
텍스트 데이터 분석 관련, 매스웍스는 ‘텍스트 애널리틱스 툴박스(Text Analytics Toolbox)’를 통해 인간의 언어에 담긴 감정을 분석하고, 자료를 분석·분류·요약함으로써 자연어 처리의 효율성을 높여준다.

SR(Mathworks)-3.jpg

[베이커 휴는 매스웍스와 협력을 통해 셰일가스 추출 펌프 모델에 대한 시뮬레이션을 통해 충분한 양의 고장 데이터를 확보했다.]

마지막으로, 매스웍스는 장애 발생 시기 및 잔여수명(RUL) 예측기능을 탑재한 예측적 유지보수 애플리케이션을 개발하기 위해 과거의 수많은 IoT 및 스트리밍 데이터를 활용하고, 급속한 환경 변화로 인해 충분한 양의 데이터를 지속적으로 수집하기 어려운 경우 가상의 오류 데이터를 생성한다. 특히, 매스웍스의 시뮬링크(Simulink)는 자동 튜닝을 통해 실제 환경에서 측정된 데이터 값과 가장 유사한 결과를 도출하는 예측 정확도 높은 모델을 개발하도록 지원한다.
예를 들어, 에너지 기술 기업 베이커 휴(Baker Hughes)는 매스웍스와 협력을 통해 머신러닝 기반의 정확도 높은 예측적 유지보수 소프트웨어 개발을 위한 테라바이트(TB) 규모의 다양한 센서 데이터를 손쉽게 접근, 분류 및 분석할 수 있었다. 셰일오일 추출 장비인 펌프의 고장에 대한 데이터 양이 부족했기 때문에, 해당 펌프의 작동방식을 본딴 모델을 개발, 가상으로 모델에 오류를 발생시키는 시뮬레이션을 통해 잔여수명을 도출하는 머신러닝 알고리즘을 개발했다. 이는 기존의 약 1/10의 개발 시간 안에 가능했다. 
 

자동화된 최적 머신러닝 모델 개발 

  SR(Mathworks)-4.jpg

[매스웍스코리아가 지난 18일(목) 개최한 ‘매트랩을 활용한 데이터 과학과 머신러닝 응용’ 온라인 세미나에서 매스웍스코리아 장규환 차장이 머신러닝의 활용 분야를 설명하고 있다.]

머신러닝은 인풋 데이터를 바탕으로 아웃풋을 도출하도록 설계된 모델에서 새롭게 변화한 데이터를 모델에 스스로 학습시켜 해당 모델을 업데이트할 수 있는 유용한 기술이다. 비선형적 인풋-아웃풋 구조의 음성 인식, 물체 탐지, 엔진 수명 예측, 실시간으로 변화하는 데이터 기반의 동적 프로그래밍인 주식 시장 예측 및 날씨 예측, 확장 가능한 빅데이터 기반의 IoT 분석, 택시 요금체계 및 항공기 지연 분석 등에 적용돼 효과를 내고 있다. 산업 분야로는 국방 및 우주항공, 전자 및 디지털 헬스, 오토모티브, 산업 자동화 등에 도입된다.
현재 많은 산업에서 일련의 머신러닝 개발 과정을 하나의 플랫폼에서 수행하고자 하는 수요가 높아지는 가운데, 매스웍스는 데이터 액세스부터 모델링 및 시스템으로의 배포까지 전체 머신러닝 워크플로우를 지원하는 툴박스를 제공한다. 뿐만 아니라, 머신러닝 워크플로우 단계별로 존재하는 페인포인트를 해결한다.

SR(Mathworks)-5.jpg

[매스웍스의 매트랩은 머신러닝 워크플로우 5 단계별 페인포인트를 모두 해결한다.]

매스웍스의 자동화된 머신러닝 개발 솔루션 오토ML(AutoML)은 ‘특징 추출’ 과정을 자동화한다. 특징 추출 과정은 컴퓨터의 머신러닝 모델 학습이 가능하도록 데이터를 준비하는 과정에서 데이터의 핵심적인 특징을 생성(Feature Generation), 선택(Feature Selection) 및 변형(Feature Transformation)하는 것을 의미한다. 매스웍스의 오토ML을 통해 도메인 데이터에 대한 이해도가 부족한 데이터 과학자 또는 개발자도 손쉽게 핵심적인 특징만 추출해낼 수 있게 돼 모델 과적합(overfitting; 부적합한 새로운 데이터를 기반으로 모델링하여 기대 이하의 결과값이 도출되는 현상)을 방지하고, 모델의 설명가능성(interpretability; 선별된 특징에 대한 해석가능성 향상)을 개선하며, 모델의 사이즈를 줄일 수 있다.

SR(Mathworks)-6.jpg

[매스웍스의 자동화된 머신러닝 개발 솔루션 오토ML(AutoML)은 ‘특징 추출’ 과정을 자동화한다.]

둘째로, 매스웍스의 오토ML은 자동화된 머신러닝 모델 훈련을 통해 준비를 마친 데이터의 특징에 적용할 수 있는 최적의 모델(알고리즘)을 자동으로 찾아서 추천해준다. 현재 엔지니어들은 무수한 알고리즘의 선택의 문제에 대한 페인포인트를 경험한다. 예를 들어, 분류(Classification) 및 회귀(Regression) 알고리즘의 경우, 사용 가능한 알고리즘은 각각 10개와 6개 이상이다. 매스웍스의 오토ML은 개별 알고리즘 기반 훈련과 시행착오에 드는 시간을 제거함으로써 머신러닝 개발의 효율성 및 생산성을 향상시켜주는 중요 혜택을 제공한다. 최적의 모델 선택 문제를 해결하는 것에서 나아가, 매스웍스의 오토ML은 하이퍼파라미터(모델 훈련 시 변하지 않는 파라미터) 튜닝으로 모델을 매우 간단하고 빠르게 최적화할 수 있다.

SR(Mathworks)-7.jpg

[매스웍스의 오토ML(AutoML)은 최적화된 모델 구축을 간소화 및 가속화한다.]

마지막으로, 매스웍스는 매트랩 코더(MATLAB Coder), 매트랩 컴파일러(MATLAB Compiler) 및 매트랩 컴파일러 SDK(MATLAB Compiler SDK)를 통해 임베디드 하드웨어 및 엔터프라이즈 시스템 상의 머신러닝 응용사례에 맞춰 C, C++, HDL, PLC, CUDA, 자바(Java), 파이썬(Python) 등 머신러닝 모델에 대한 다양한 코드를 생성하고 배포할 수 있다.

leekh@seminet.co.kr
(끝)
<저작권자(c) 반도체네트워크, 무단 전재-재배포 금지>

X


PDF 다운로드

개인정보보호법 제15조에 의한 수집/이용 동의 규정과 관련하여 아래와 같이 PDF 다운로드를 위한 개인정보 수집 및 이용에 동의하십니까? 동의를 거부할 수 있으며, 동의 거부 시 다운로드 하실 수 없습니다.

이메일을 입력하면,
(1) 신규참여자 : 성명/전화번호/회사명/분야를 입력할 수 있는 입력란이 나타납니다.
(2) 기참여자 : 이메일 입력만으로 다운로드가 가능합니다.

×

회원 정보 수정