뒹굴뒹굴

뒹굴뒹굴

  • 개발새발 (56)
    • Study (21)
      • Information Retrieval (21)
      • Machine Learning (0)
    • Development (32)
      • Android (3)
      • Web (0)
      • R (0)
      • Python (0)
      • Virtualization (1)
      • DB (5)
      • Hadoop (17)
      • Spark (4)
      • Kafka (1)
      • Linux (1)
    • Etc. (2)
      • Car (1)
      • Travel (1)
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

뒹굴뒹굴

컨텐츠 검색

태그

hadoop Nova Maldives MiddleManager 색인 정보검색론 kafka maldive scheduler Yarn 노바리조트 information retrieval RDD HBASE Compaction 하둡 android tuning ubuntu spark Druid

최근글

댓글

공지사항

아카이브

SVMModel(1)

  • 간단하게 Spark ML Model 로딩하기 (Decision Tree)

    Spark ML을 사용하여 간단하게 ML을 비즈니스 로직에서 활용하고 싶을 때가 있다. 그리고 그 비즈니스 로직에서 ML을 여러 개 사용하고 싶을 때도 물론 있다. 하지만 문제는 이때부터 발생한다. Spark ML에는 다양한 ML 기능이 RDD 혹은 DataFrame을 이용할 수 있도록 구현되어 있는데, 이 모델을 저장하고 로딩할 때 기본 라이브러리를 이용하면 각 모델마다 지연시간이 발생한다. load 함수를 호출할 때마다 Spark Task로써 SVMModel, DecisionTreeModel, GradientBoostedTreesModel 등의 모델 로딩이 수행된다. 하지만 이 로딩 과정이라는게 위 언급한 모델에서는 별 것 없다. 결과는 단순히 의사 결정 나무일 뿐이고, GBT 같은 경우는 이 트리가..

    2019.08.11
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바