2018년 8월 30일 목요일

[2018-08-30] Today's Google News : JP모건, 구글의 인공지능 전문가 영입

Today’s Google News with Megazone




금융회사들 마다 인공지능을 통한 서비스 제공을 위해 인공지능 전문가
영입 경쟁에 나선 가운데 JP모건이 구글에서 전문가를 영입




아산나눔재단, 구글 캠퍼스 서울과 창업 생태계 내 다양성 증대

위한 프로그램 진행


아산나눔재단이 구글 캠퍼스 서울과 함께 스타트업 커뮤니티 다양성 증대를
위한 프로그램을 진행하고 성과를 공유하는 자리를 가졌다고 30일 밝혔다.


인공지능이 집까지 지킨다...구글·카카오 등 AI와 연동 강화


인공지능(AI)이 집을 지킬 날이 머지않았다. AI가 실시간 침입 상황을 알려주고,
음성으로도 각종 제어가 가능해진다.







2018년 8월 27일 월요일

[2018-08-27] Today's Google News : 인공지능 관심 있다면 알아두어야 할 기술 5

Today’s Google News with Megazone




신 러닝(ML)과 인공지능(AI)은 IT 분야에서 새롭게 떠오르고 있는 경력 코스로,
현재 기업들은 이 분야의 전문가를 먼저 확보하기 위해 애쓰고 있다. 그러나
아직 시장에는 머신 러닝과 인공지능에 능통한 인재가 충분치 않다.


FAANG(페이스북·애플·아마존·넷플릭스·구글) →
MAGA(마이크로소프트·애플·구글·아마존)?


클라우드 하드웨어 보안 모듈


클라우드 하드웨어보안모듈(HSM)은 클라우드 기반 HSM이다. 기본
역할은 암호화 키 생성·저장·처리 등이다. 네트워크 연결 상태에서
부하 처리에 무리가 없어야 하며, 유연한 확장성을 보장해야 한다.
전용 하드웨어가 전담하기 때문에 소프트웨어 전용 암호 기술에
내재된 보안 취약점을 해결할 수 있다.


클라우드로 인해 혼잡해진 네트워크, IT의 적극적 역할 필요하다

기업이 IT 인프라와 서비스의 점점 더 많은 부분을 클라우드로 이전하면서 IT
부서는 이런 혼란을 정리하는 일을 떠맡게 됐다. 정작 IT는 이런 상황을 만드는 데
관여한 적이 없다.






2018년 8월 23일 목요일

[2018-08-23] Today's Google News : 구글 드라이브에 스마트폰 데이터 백업

Today’s Google News with Megazone





스마트폰 데이터를 간단히 백업할 수 있는 방법을 소개합니다. 모바일 앱 가운데,
비교적 많이 사용하는 구글 드라이브로 골라봤습니다.




공동배치(Colocation) 플랫폼의 특정 하드웨어 형태가 될 수 밖에 없던 기존
암호화폐 거래소의 단일 아키텍처로 인한 확장성 문제를 극복한 클라우드
네이티브(Cloud-Native) 방식의 새로운 플랫폼 ‘엑스크래프트(ExCraft)’ 암호화폐
거래소가 론칭했다.


DNS가 ‘보안홀’로 주목받고 있다. DNS 보안 취약성에 대한 경고는
새로울 것이 없지만, 2016년 DNS 서비스 기업 DYN이 미라이 봇넷으로 대규모
디도스 공격을 당한 후 DNS 보안에 대한 인식이 크게 달라지게 됐다.


클라우드 컴퓨팅 혁명 초기, 사용한 만큼 돈을 낸다는 개념이 등장해 좀더
효율적인 IT소비 시대가 열리는가 기대했던 적이 있었다. 물론 실제로 IT지출
효율화에 성공한 사례도 있었고, 덕분에 매우 빠른 속도로 성장한
웹 기반 기업도 있었다.



2018년 8월 22일 수요일

[2018-08-22] Today's Google News : 미·중 IT 기업 격전지, AI와 클라우드·빅데이터

Today’s Google News with Megazone



 

미·중 IT 기업 격전지, AI와 클라우드·빅데이터


미·중 무역전쟁의 배경으로 '중국 굴기(우뚝 섬)'가 언급된다. 달라진 중국이
세계 초강대국인 미국을 위협하고 있다는 것이다.



"내년이면…블록체인이 구글독점 영상 생태계 뒤흔든다"


세계 최대 전자상거래 플랫폼 아마존 창업자 제프 베이조스, 클라우드 컴퓨팅
기반 고객관리서비스(CRM)인 세일스포스 창업자 마크 베니오프. 새로운
시대정신을 남들보다 앞서서 읽고 글로벌 기업가 반열에 오른 선구자들이다.

"5G, 반도체…” 미래산업 제패 향한 G2 '왕좌의 게임'


"미·중 기술냉전의 첫 번째 피해자는 ZTE가 될 것이다."

지난 5월초 미국 뉴욕타임스(NYT) 기사 제목이다. 도널드 트럼프 미국 대통령이
당시 ZTE에 대해 7년간 미국기업과 거래를 금지하는 제재령을 내린 것을
두고 한 말이다.







[G suite]Gmail 아웃룩(outlook) 연결(연동)시 오류가 발생될 때


보안 수준이 낮은 앱의 계정 액세스 허용

Google은 최신 보안 표준을 사용하지 않는 앱이나 기기에서 이뤄지는 로그인 시도를 차단할 수 있습니다. 이러한 앱이나 기기는 해킹에 더 취약하기 때문에 차단하면 계정 보안을 강화할 수 있습니다.
최신 보안 표준을 지원하지 않는 앱은 다음과 같습니다.
  • iOS 버전 6 이하를 사용하는 iPhone 또는 iPad의 Mail 앱
  • Windows Phone 8.1 이전의 Mail 앱
  • Microsoft Outlook과 Mozilla Thunderbird 같은 일부 데스크톱 메일 클라이언트
자세한 사항은 Google 계정 고객센터 (<-- Click)를 참조해주시기 바랍니다.

보안 수준이 낮은 앱에 대한 계정 액세스 변경

계정이 로그인되어 있는 상태에서 아래와 같이 url 을 클릭하여 진행합니다.
* 일반적인 아웃룩 설정은 Gmail 고객센터 (<-- Click) 를 참조해주시기 바랍니다.
* 보안 수준이 낮은 앱 사용안함 대신, 2단계 인증 사용 시 아웃룩 사용을 하려면 앱 비밀번호가 필요합니다. Google 계정 고객센터 (<-- Click) 를 참조해주시기 바랍니다.

출처 : GSuiteKorea블로그

2018년 8월 20일 월요일

[2018-08-20] Today's Google News : "구글 '스마트 디스플레이' 연말 출시"…가격도 떨어진다

Today’s Google News with Megazone



       "구글 '스마트 디스플레이' 연말 출시"…가격도 떨어진다



레노버가 최근 구글 어시스턴트를 탑재한 인공지능(AI) '스마트 디스플레이'를 출시하며 지난해 아마존이 내놓은 디스플레이형 스마트 스피커 '에코 쇼'와 '에코 닷'에 맞불을 놓은 가운데, 구글이 올해 말 크리스마스 시즌에 맞춰 직접 만든 스마트 디스플레이를 내놓을 계획이라고 17일(현지시간) 닛케이 아시안 리뷰가 보도했다.


한발 뺀 구글 “중국 전용 검색 엔진, 아직 아니다”



순다르 피차이 구글 최고경영자(CEO)가 중국 시장을 위한 검색 엔진 출시가 빠른 시일 내에 이뤄지지 않을 것 같다고 밝혔다. 중국 진출을 위해 ‘검열이 가능한’ 검색 엔진을 개발하는 것은 부적절하다는 내부 여론을 의식한 것으로 보인다.



블루투스 추가된 구글 차세대 '크롬캐스트'…와이파이 성능도 향상



구글의 차세대 크롬캐스트는 블루투스 지원 뿐만 아니라 와이파이 기능도 향상될 것으로 보인다고 외신이 보도했다.
구글이 올해 5월 미국연방통신회(FCC)에 제출한 문서에 따르면 차세대 크롬캐스트는 돌출된 HDMI 포트를 갖춘 기존 원형 디자인을 계승할 것으로 예상된다.









[GCP] Big Query ML 이용해 보기 (1부)



이번 포스트에서는 Binary logistics Regressor 이용한 Classification Model BigQuery ML 이용하여 만들어 보고자 한다

앞서 이야기한대로 BigQuery ML Linear Regression(선형 회귀), Binary logistic regression(이진 로지스틱 회귀) 모델을 생성   있다



Linear Regressor 수치를 예측 하고자  , Binary logistics regression 분류 예측을 하고자 할때 사용한다

이번 Post Google Merchandise Store 구매 자료를 토대로 방문자의 구매 확률에 대해 예측 하는 모델을 생성 하고실제 생성된 모델을 기반으로 실제 구매 여부  모델 평가(Model Evaluation)까지 해볼 것이다



1. 데이터 탐색 및 데이터 이해하기
 우선 Machine Learning 위해서는 데이터에 대한 이해  탐색그리고예측을 위해 필요한 데이터의 특성은 무엇인가에 대한 이해가 선행 되어야 한다우선 데이터의 이해를 위해 전체 방문자 대비 구매자의 비율을 구하는 쿼리를 수행 해보도록 한다


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#standardSQL
WITH visitors AS(
SELECT
COUNT(DISTINCT fullVisitorId) AS total_visitors
FROM `data-to-insights.ecommerce.web_analytics`
),
purchasers AS(
SELECT
COUNT(DISTINCT fullVisitorId) AS total_purchasers
FROM `data-to-insights.ecommerce.web_analytics`
WHERE totals.transactions IS NOT NULL
)
SELECT
  total_visitors,
  total_purchasers,
  total_purchasers / total_visitors AS conversion_rate
FROM visitors, purchasers
cs





`data-to-insights.ecommerce.web_analytics` 는 BigQuery ML을 Test 하기 위해 Merchandise Store의 데이터를 공개한 것이며, 위의 데이터는 전체 방문자 대비 실제 구매자를 구하는 데이터이다. 위의 with절의 visitor는 방문자의 ID를 Count 하는 데이터이고, purchasers는 전체 데이터중 transaction Flag가 있는 경우를 거래가 이루어진 것으로 보고, Count 한 데이터이다. 



[그림1. 방문자 대비 구매자비율]


전체 방문자 수는 741,721명이며(이는 전체 방문 횟수가 아닌 전체 방문자의 수이다.) 이 방문자들 중 실제 구매 한 사람의 수는 20015명이다. 즉 (20,015/741,721)*100 = 2.69%의 방문자가 Login 후 구매를 진행 하는 것을 알 수 있다. 

두번째로는 매출과 수익에 대해 상위 5개를 구하는 Query이다. 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
#standardSQL
Select prod_name
  , prod_cat_name
  , Format("%'d",CAST(units_sold AS int64))   as unit_sold
  , Format("%'.2f",CAST(revenue AS float64))  as revenue
  From (
        SELECT
          p.v2ProductName prod_name,
          p.v2ProductCategory prod_cat_name,
          SUM(p.productQuantity) AS units_sold,
          ROUND(SUM(p.localProductRevenue/1000000),2) AS revenue
        FROM `data-to-insights.ecommerce.web_analytics`,
        UNNEST(hits) AS h,
        UNNEST(h.product) AS p
        GROUP BY 12
        ORDER BY revenue DESC
        LIMIT 5
);
cs



[그림 2. 상위 5개의 매출 및 수량]


해당 쿼리는 전체 매출 중 가장 많이 팔린 상품 명과 수량을 구하는 쿼리이며, 상위 5개를 보여주는 쿼리이다.이때, From 절의 Inline View 쿼리 중 UNNEST(hits), UNNEST(h.product)를 볼 수 있는데, 이는 해당 Table의 Denormalize 된 테이블의 Reapeat Column을 사용하는 것이고, Target Table의 Dataset의 1개의 Row에 대응되는 Repeat 컬럼에 대해 배열로 나열 하여, 연산 하는데 사용하려는 것이다. 다시 말해 Unnest Keyword는 Denormalize 된 Table의 Row에 대해 하나의 배열 타입으로 바꿔서 하나의 테이블로 인식 하는 역할을 해주는 것이다. 즉, Query 상에서 Table의 Row에 대해 1:N의 형태로 풀어 주는 역할을 한다. 


2. 예측하고자 하는 목표 확인

앞서 탐색한 데이터를 기반으로 Machine Learning Model을 통해 확인 할 수 있는 것은 새로운 방문자가 향후에 구매 할 가능성이 있는 가를 확인 할 수 있다. 이는 주요 타켓 고객을 확인 함으로써, 구매 할 확률이 높은 고객에 대해 마케팅이 가능 해진다. 

 우리는 앞서 첫 번째 쿼리를 통해 방문자 대비 방문자의 구매비율을 알 수 있고, 두번째 쿼리를 통해 가장 많이 판매 된 상품을 알아 보았다. 해당 DataSet에서 유입 Channel이 확인이 되고, 해당 사용자가 어떤 유입 경로를 통해 구매자에 대해 유입 및 구매 여부를 알 수 있었다. 

해당 DataSet이 만들어 지는데 수집 경로가 되는 GA(Google Analytics)는 E-Commerce에서 사용자의 방문에 대한 특성 항목 및 측정 값을 수집한다. 우리는 유입되는 데이터 중에서 알아 봐야 할 부분은 사용자가 사이트에서 방문 후 얼마 만큼의 시간을 보냈는가와, 사용자가 바로 떠났는가에 대해 중점적으로 알아 볼 필요가 있다. 여기서는 totals.bounces [방문객이 거래를 일으키지 않고, 사이트를 바로 떠났는가에 대한 여부. 데이터는 (1 Or Null)로 표시], 그리고 totals.timeOnSite [방문객이 머문 시간 초 단위]로 확인 할 수 있다. 

두가지의 컬럼 만을 이용 했을 시 정확한 Machine Learning 모델을 만들 수 있을지는 아직은 알 수 없다. 하지만, 두가지 데이터로 학습을 했을 때도 정확한 모델을 가질 수 있을지는 나중에 확인 해볼 수 있다. 아래의 쿼리를 통해 데이터를 검색 해보도록 하자. 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
#standardSQL
SELECT
  * EXCEPT(fullVisitorId)
FROM
  (SELECT
    fullVisitorId,
    IFNULL(totals.bounces, 0) AS bounces,
    IFNULL(totals.timeOnSite, 0) AS time_on_site
  FROM
    `data-to-insights.ecommerce.web_analytics`
  WHERE
    totals.newVisits = 1)
  JOIN
  (SELECT
    fullvisitorid,
    IF(COUNTIF(totals.transactions > 0 AND totals.newVisits IS NULL> 010
        AS will_buy_on_return_visit
  FROM
      `data-to-insights.ecommerce.web_analytics`
  GROUP BY fullvisitorid)
  USING (fullVisitorId)
ORDER BY time_on_site DESC
LIMIT 10;
cs

[그림 3. 예측을 위한 Query 수행]


해당 쿼리 결과로 Model을 만들 것이다. 그렇다면 해당 쿼리에서 Feature(특성)은 무엇인가? 바로 bounces와 time_on_site이다. 그렇다면 정답인 Label은 무었인가? 바로 will_buy_on_return_visit. 즉 다시 돌아와서 구매 했는지 아닌지 여부이다. 우리는 방문자가 다시 돌아와서 구매를 진행 할 것인지 아닌지 여부를 Machine Learning을 통해 알아 보는 Model을 생성하여 예측 해볼 것이다. 

하지만, 해당 데이터를 통해 우리는 해당 데이터를 가지고 좋은 Machine Learning모델을 얻을 수 있을 것인가에 대해서는 아직 모른다. 그리고 쿼리를 검색 해보면 알겠지만 예측에 대한 Accurancy는 단 1건만이 존재 하므로 좋은 지표는 아닐지도 모른다. 

정말 좋은 Model이 생성이 될지 아닐지에 대해서는 다음 Post인 Model 생성에서 알아 보도록 하겠다. 

[출처 : http://warehousekeeper.tistory.com/8]