2018년 8월 2일 목요일

[GCP] Democratization of Machine Learning - Bigquery ML



지난주 미국 San Francisco Mountain - View에서 있었던 Google Next'18 에서 Big Query ML에 대한 Announce 가 있었다. 이번 포스팅에서는 Big Query ML에 대한 간략한 소개에 대해 이야기 해보고자 한다. 




BigQuery ML은 말 그대로 Big Query 내에서 Machine Learning Model을 생성 할 수 있는 서비스이다. 기업의 데이터 분석가들은 데이터를 활용한 분석 및 예측을 위해서는 R, Python 등 언어를 습득해야 하고, 데이터에 대한 이해도가 높은 사람만이 할 수 있어, 소수 인원의 전유물 처럼 여겨 졌다. 
이에 Google은 개발 언어를 배우지 않고도, 쉽게 Machine Learning Model을 생성 할 수 있도록 SQL만으로 데이터를 분석 할수 있는 Platform인 BigQuery에 Machine Learning Model을 생성 할 수 있도록 서비스하기 시작하였다. 이와는 별도로, Cloud Auto ML을 발표 하였는데, Cloud AutoML은 인식 시스템의 기계 학습 / AI 사용한 사용자 정의 기계 학습 모델 구축을 On-Premise에서 실행할  있도록하고있다. Cloud AutoML 이미지 내의 물체 인식 / 분류뿐만 아니라 문서의 분류번역에 대응 했다.

아래는 BigQuery ML의 Model 생성 및 이를 이용한 예측을 하는 방법을 간단히 설명하는 Image이다. 
[ 출처 : Google Cloud Big Query ML Documentation ]


1. Create Support Model 

- Linear Regression - 연속성을 가지는 수치 데이터에 대해 예측을 위한 모델.
- Binary Logistics Regression - 쉽게 말해 Classification. A인가? B인가혹은 어느 군집에 속하는가를 판별 하는 모델.


2. Quota  Limitation & Pricing

- BigQuery ML Machine Learning 위한 Model 생성하는데 쓰이는 Query 대한 Quota 따른다. Create Model 대한 Quota 없다자세한 내용은 Big Query Quotas and Limits 에서 확인 바란다.

3. 사용 가능 환경 
- BigQuery UI
- bq CLI Tool
- Big Query Rest API 
- Jupyter Notebook 또는 BI Platform 같은 외부 플랫폼

다음 포스팅은 Big Query ML을 간단히 사용해보는 포스팅을 해보고자 한다. 

댓글 없음:

댓글 쓰기