Google Cloud OnBoard に行ってきました
API等で遊んだことはあるものの、サービス全体は把握してなかったので勉強のために行ってきました。
いまなぜGCPを学ぶのか
まじめな話、技術とか知識のコモディティ化は、本気で何かの境界線を超えた気がする。。。。もうとにかく、まずは個人で勉強して試してみる、というマインドセットがないと、絶対にきのこれない。教えてくれるのを待ってると死ぬ。 https://t.co/3T8DZIFyHg
— E. Nakai (@enakai00) November 25, 2016
冒頭はこのお話。
もはやユーザー企業のエンジニアの方がテクニカル。
- 昔はベンダーの方が上だったが、それは情報量の問題だけだった。
1980年代:PC市場の拡大によるコンピュータの個人ユース
- 1990年代:光回線への戦略投資によるネットワークインフラの開放
2000年代:オープンソースの発展による高度なSW技術の無償化
- KubernetesはBorgのアーキテクチャを再実装してOSSとした。。
モジュール 1 - Google Cloud Platform のご紹介
モジュール 2 - Google Cloud Platform 入門
- プロジェクト名は重複可能。
- Organization使うなら、G-suiteアカウントを取った方がよい
サービスアカウントはEメールで認識され、他のサービスへの認証に使われます。(時期により違う)
- <project_number>@developer.gserviceaccount.com
- <project_id>@developer.gserviceaccount.com
APIs Explorer超便利。
お昼休みはTensorFlowのお話。鳥獣戯画風のTensorFlowロゴ
モジュール 3 - Google App Engine と Google Cloud Datastore
モジュール 4 - Google Cloud Platform ストレージのオプション
NoSQL/ドキュメント/オブジェクト/RDBMSなどいろいろなデータストアまで含んで、Google CloudStorage というサービス名。
モジュール 5 - Google Container Engine
- CloudShellからkubectlでコンテナの定義ファイル(YAML)のバージョンを書き換えると、裏でローリングアップグレードしてくれる。
モジュール 6 - Google Compute Engine とネットワーキング
- ディスクのリサイズ、サイズアップダウンもダウンタイムなし。
- プリエンプティブルVMなら8割引
- いつシャットダウンされるがわからないのでキューと組み合わせて使うとよい
- デモ
- HTTP(s)ロードバランサはGSLBとして動く
- 複数のリージョンにバランシング
- 通常はアクセス元から近いリージョンに割り振る
- ネットワークロードバランサはリージョン内のComputeのみバランシング
- Stackdriverは検索のみで集計はできないので、BigQueryにエクスポートして利用
Googleのロードバランサはいつ聞いても強力すぎる。
モジュール 7 - Big Data
- BigQueryはデフォルトでフルスキャン
- そのためにデータをコマ切れにして複数のディスクに保管。
- RUN QUERYしたタイミングで、ディスクごとにデータを読み取るためのコンテナを立ち上げている
モジュール 8 - Google Machine Learning
前のセッションを受けて
- データの分散時にネットワークを挟むことはボトルネックにならない
- とにかくディスクの玉がネック
- ネットワークをそれなりにチューニングしていれば…
Googleではプロセスとデータは同じサーバに置かない、が鉄則。
Google翻訳でのデモ
- 日本語は所有格を書かないため、うまくいかないことがある。
- OK:「彼が誕生日を忘れたので、彼女は怒った」
- NG:「彼女が誕生日を忘れたので、彼は怒った」
- 論理的にどちらの英訳が正しいかは判断できないが、「よく忘れるのは彼」という検索ワードがあって、そこから学習したのではないかと推測
Googleでは開発者たちも多国籍にすることで知らない間にバイアスのかかったコードが書かれないようにしている
- 顔認識のサンプルに含めていなかったため、黒人に反応しない問題が以前あった
英国のオンラインスーパーの会社の事例
- お客様からのメールをTensorFlowで学習
- 怒り/感謝などを学習し、怒り度の高いものは優先的に返答が必要、などの仕分けを自動的に行う
感想
AWSはIaaS寄りでサービス多数の提供なのに対して、GCPはPaaS、強力なSaaSがメインでComputeエンジンはオマケな感じ。
SoftLayerとBluemixを別にブランディングとしてるIBMとは違いますね。 と思ったらブランド統合されて、Bluemixになっていたのか。 ユーザ会の名前どうするんだろうか。
今後について
後日、修了証と本日の資料のPDF版と、ハンズオンのフリートライアルクレジットが送付されてくる。
2017/1中旬にフリーハンズオンイベントを実施予定。フォローアップメールを待ちます。
最後はアンケートを出すだけで全員にTシャツをプレゼント。太っ腹。