[빅데이터/인공지능 목차]

 

개념 : 탈중앙 데이터(de-centralized data) 기반 새로운 머신러닝 패러다임

  • 분산된 환경에서 사용자의 데이터를 중앙서버에서 학습하지 않고, 개인의 휴대폰에서 모델을 학습하고, 학습된 결과를 중앙 서버에서 취합 후 개선된 공통 모델을 생성하는 기술
  • 기기나 기관 등 여러 위치에 분산 저장된 데이터를 직접 공유하지 않으면서, 서로 협력하며 AI 모델을 학습할 수 있는 분산형 머신러닝 기법
  • 고성능 중앙 서버 대신에 성능이 부족하지만 여러 대의 컴퓨팅 자원을 활용해서 알고리즘을 학습한 뒤, 각각의 컴퓨팅 자원에서 학습된 결과를 통합하여 최종 학습 모델을 만드는 방법
  • 개인 정보보호 문제와 학습에 많은 시간이 소요되는 단점 해결할 수 있는 학습방법

 

연합 기계학습 동작방식

  • 전역 모델 기준 로컬 학습 결과를 중앙 모델을 업데이트하고 결과를 다시 로컬로 전송하는 과정을 반복
  1. 중앙 Global 모델 전송
  2. 로컬 Data 기반 학습 후 로컬 Gradients를 암호화 전송
  3. 보안 Aggregation 및 학습
  4. 전역 모델 업데이트 결과를 로컬로 전송
  5. 로컬 모델 업데이트 및 2~5과정 반복

 

+ Recent posts