ryouma-nagareのブログ

IT関連をメインに書いていきます。

OSC 2015 Tokyo/Fallに行ってきました

イベントページはこちら

家庭の都合で日曜の午後のみ参加。 毎度のことながら、家から2時間は遠い…

残念ながら、VineLinux7のリリースが延期になった、というニュースをブースで知りましたorz

PostgreSQL 9.5の新機能紹介】

10月6日のセミナーで使用した資料+αの内容。

  • PosgreSQLはほぼ1年ごとにバージョンアップしてリリースしている。

  • 9.5β1は2015/10/8にリリース。年末から年明けぐらいに正式リリースの予定。

●新機能

  • Row Level Security
    • 設定がちょっとめんどくさい。
      • 見直されるかも。
  • IMPORT FOREIGN SCHEMA
    • マッピングを変えたい場合は、従来通りCREATE FOREIGN TABLE
  • 集計構文
    • GROUP BY GROUPING SETSの実装
  • JSONB型向け関数の拡充
    • 一部のフィールドのみの更新/削除が可能になった

---ここから資料になし---

●性能の改善

  • 多CPUの同時実行性能アップ
  • トランザクションコミット時間の参照用関数の追加
  • SELECT … SKIP LOCKED

    • 行ロックされている行を飛ばして読み込む
      • SELECT … FOR UPDATE SKIP LOCKED
  • SELECT … TABLESAMPLE

    • サンプルデータとして、指定件数を取り出せる
      • SELECT * FROM t1 TABLESAMPLE BERNOULLI(10);
  • pg_dump -snapshot
    • pg_dump複数起動しても、スナップショット名を指定することで同じスナップショットが取得できるように。
  • pg_ctl stopのデフォルトがfastに
    • Oracleで言うと、shutdown abort

電子書籍はこの先どうなるの?中の人が本音で語る電子出版ビジネスと技術書への影響】

高校の一つ下の生徒会長(達人出版会 の代表)がパネリストだったので参加。

ゆるい感じのディスカッション。

  • ページ数が少ないと紙では出せないことが多いので、その部分でのハードルは低くなったのではないか。
  • Kindleが出てからの時間を考えると、あと5年たっても紙の半分程度しか売れないのではないか。
  • 電子書籍の8~9割はマンガ。
  • フォーマット以前の問題として、ストアにロックインされるのが問題。
    • 倒産してサービス継続できずに読めなくなることがある。
    • ファイルを販売しないところが多い。
    • IT系だとファイル(PDF/EPUB)を販売するところが多いが、コミックなどは閲覧権のみの場合が多い。
  • ライセンスの問題として、会社で1冊買って社員で共有ってどうなの?
    • 出版社としては1人1ライセンスをお願いしたい。
    • ファイルを渡して自分のを消す、というふうにしていれば裁判的には負けないと思うが…
  • コストの問題でベテランの編集者を切ってしまって、スキルが下がっている。
    • 日本語の文章すら直せない
    • ベテランになると、コストを稼ぐために多くの本の編集をこなさないといけない
      • 結局、クオリティは…
    • 校正も自動化していくしかないのか

電子書籍の普及にはまだ時間がかかりそうです。

OSSプラットフォームとしてのAWS AWSを利用したOSSの普及テクニック】

@qryuuさんのお話。

  • S3
  • AMI共有
    • トライアル環境の提供
      • リージョンごとにAMIを用意する必要があります。
    • Amazon提供AMIや、コミュニティ公式AMIなど信頼できるものをベースにしてください。
  • CloudFormation
    • サーバだけでなく、RDSやキャッシュも含めたデモ環境を提供したい場合
    • 最新のパッチをあてた環境を提供したい
      • OSごとにログインできるユーザ名が違うので注意。

AWSでサービスとして提供されているOSS

MySQLPostgreSQLMariaDB、Redis、Memcached、Solr、Elasticsearch、Git、Hadoop、Hive、Pig、Mahout、Presto、Spark、Docker

NW系ソリューションの注意

  • AmazonVPCはマルチキャスト、ブロードキャストをサポートしない
    • Zabbixのディスカバリはユニキャストなので、AWSでも無問題

CTC Forum 2015 Tokyoに行ってきました

イベントページはこちら

会場はホテル日航東京あらためヒルトン東京お台場ですが、まだ新しいパネル等はできていないらしく、あちこちで上から紙が貼られている状態。

続きを読む

Developers Summit 2015 Autumnに行ってきました

マイクロソフトデータプラットフォーム使い倒せ!】

Azure SQL Data WarehouseはMPPのアーキテクチャを採用。

AzureData Lake

  • Azure Data Lake Store
  • Azure Data Lake Analytics
    • U-SQL言語と分散クエリ
      • ファイルに対してSQLを発行、ユーザ定義のクエリを再利用可能
    • VisualStudioツールによる生産性
  • HDInsight
    • Hadoop/Spark/Storm
    • Azureでの Hadoopの選択肢
      • BLOBストレージを使用可
    • CDH/HDPは MarketPlaceに登場

AzureEventHubs

  • Azure上でのスケーラブルなイベントの受信・送信
    • AMQP/HTTPをサポート
  • 同一イベントに対して複数のコンシューマグループを作成可能

Azure Stream Analytics

  • Azure上でのストリームデータ処理
    • Tumbling Window
    • Hopping Window
    • Sliding Window

Azure Machine Learning

  • Hotmail,Bing maps,Bing search,Kinectなど、Microsoft機械学習の深い知見がある。
  • 開発したAPIをMarketPlaceに公開してマネタイズするところまでサポート
  • Webベースの設計ツールなら、完全にゲストで使用も可能です。統計分析の勉強にもどうぞ!

Power BI

  • Azure上で提供されるSaaS型BIサービス
  • モバイルクライアントもあります。

Webサービス開発のエンジニア組織からアドテク志向のエンジニア組織への大転換!ーその裏側見せます―】

ランチセッションでした。 話が面白くて夢中になったのでメモ少なし。

【エンジニア目線で見たデジタルマーケティング業界のこれまでとこれから】

これまでマーケティングでは非エンジニアが活躍することが多かったが、これからはエンジニア的素養が必要になるはず。

●マーケティングとは?

  • コトラーの4Pとかあるけど…
    • 「デジタル上でもの/サービスを普及させるための手段」でいいのでは?

●マーケティングファネル

  • AIDA,AIDASなどのモデルがある

●カスタマージャーニー

  • マーケティングファネルを具体化したもの

●アドテクが流行ったことの功罪(罪)

  • 事業者側は効率の追求に走り始めた
  • セグメントの数が増加していくと、セグメントごとのクリエイティブや施策の検討材料が増える
  • マーケティング担当者/代理店の担当者の業務量が増加
  • 効果が上がった分の費用が別のところに行ってしまい、ベンダーは悲しくなる

●ユーザ拡張の意味

  • 突然ターゲティングされ始めるの何で?
    • 購入したユーザのセグメントに似たユーザをターゲットにし始めるから

全く興味の無い分野の広告が表示されるのはこれが原因。
購入にいたるまでのフローを逆にたどる ので気持ち悪い。

●今後面白そうなところ

  • アドブロック
  • マーケティングオートメーション
  • ネイティブアド
  • オンラインとオフラインの統合

●動画広告
獲得系の広告、認知系の広告ともオンラインだけでは限界

  • 大きな代理店が出てきて…

SSP(Single Source Pannel)
オンラインとオフラインの壁を越えるためのもの

  • リサーチデータの一種
  • 協力者から情報の接触や消費行動を収集したもの

しかし、母集団が少ない、データが歪んでいるなどの問題があるので、

  • 統計手法から母集団を類推する必要がある。

●オンライン/オフラインの統合が確実に進みつつある

  • コールセンターなどで顧客とのやりとりを分析するの面白い
    • ただし、気持ち悪いと思われないようにしたいですね

●まとめ

  • データを利用してPDCAを回すというマーケターの理想型があった
  • マーケティング業界における制約を理解する
  • その上で技術をどこにあてはめるかを考えていきたい
  • 気持ち悪いと思われないように、エンジニアが歯止めをかけたい

「気持ち悪いと思われない」が3回。ユーザーの立場から考えるとすごく大事な言葉。

【なぜテスラを買う人は 43日前に一人旅をするのか?~多次元データベースによる未来予測の実現~】

撮影不可、あとから資料公開も無しなので聞き流してました。

【データファースト開発 〜 開発チームのためのデータ分析環境の構築と継続的改善の仕組み】

システム改善のサイクルは

  • 現状把握
  • 改善案の策定
  • 設計・実装

今日はアドテクとかマーケティングではなく、 サーバサイドエンジニアの立場で 現状把握のお話をします!とのこと。

●現状把握に何分かかるか?

  • 定型的な集計なら即時
  • アドホックな分析だと1週間以上も…

●時間がかかることによる弊害

  • 本当に困るまで調査しなくなる
    • 根拠のない思い込みによる誤った判断
    • 古い調査結果に基づく誤った判断
  • データを見るには特異なスキルが必要だと認識
    • データ抽出&分析の属人化

●どの行程に時間がかかるのか?

  • ETL、データ抽出は分析対象のデータサイズに依存
    • 結果が得られる範囲でしか分析しない、というようなことに陥る。
      • 理想は誰でも気軽に分析ができるべき

●理想に向けて必要なこと

  • データへのアクセスが容易
  • 高い応答性(理想は5分以内)
    • 最重要!
  • 手順の再現性

●やったこと

  • 分析用に専用のログを出力するようにした
    • Apacheのログ、とかではなく分析用に項目を精査したログを出力する
  • 基盤の構築
    • BigQuery、Spark
    • Google Cloud Storage
    • Apache Zeppelin、Jupyter

●データ分析基盤の構成

  • fluent pluginでBigQueryに送信
  • 分析ログ以外はSpark/S3などに保存して、必要なときに使用

なぜこの構成?

  • 応答性を重視
    • BigQueryではIndex的なものの定義が不要
  • 用途/データソースで環境を使い分ける
    • 機械学習を使いたいときにはSparkやScikit-Learn
    • 分析ログに含まれないものはSpark

●応答性を重視する理由

  • フィーリングは重要
    • 直感は案外正しい
      • 根拠が欲しい
  • 結果を得るのに時間がかかると
    • 調査コストを考えると、遊びのある調査ができない
    • 思いついてから10分以内には結果が欲しい

調査に1週間かかります!遊びの調査です! とは言えないのでw

●使い方を共有するために

  • Zeppelin、Jupyterではノートブックに他の人の分析手順が残っている。
    • 一番役にたった!

●エンジニアはデータ分析基盤を何に使うのか?

  • 開発項目の選定
  • システム改善の事前/事後の評価
  • 運用フローの改善

●まとめ

  • 速いことは正義!
  • 誰でも、データアクセスできるといいことがある
    • 開発者が自分で機能を評価できる
    • 改善サイクルを回すスピードがあがる
  • データを見られないことはリスク と捉えるべき

AWSで作るオムニチャネル戦略実現のためのマーケティング・プラットフォーム】

●クラスメソッドビッグデータ
2013年のAmazonRedshiftの公開がきっかけ。

●データ分析基盤への期待

  • セルフBI
    • いちいちSQL書くのは…
  • 大量データ
    • Excelに入りきらないよ…
  • スケールする

…といった機能を「いますぐ使いたい」と言われる。

●CSデータ(カスタマーストーリー)
クラスメソッドでは”CSデータ”としてパッケージ提供しています

  • Redshift×Tableauがシステムの中心

●構成例

  • TalendなどのETLツールで整形済みデータをS3に投入
    • S3→Redshiftに投入
  • センサー機器などはKinesis
    • KCL AppsでRedshiftに投入
  • Tableauで分析

という流れ。Redshiftが中核です。

資生堂のPOS,そしてAWSといえばスシローの事例(Kinesis)の紹介

●CSモバイル
使用しているコンポーネントの数が多すぎてメモ取れなかったので、資料公開を待つ。

ビッグデータに効くAWSの新サービスおよびアップデート
新サービスで

  • サーバーレス
    • EC2を使用せず、マネージドサービスのみで構築できる
  • リアルタイム分析
  • IoT
    が可能に。

EC2無しでシステム構築、ってのは結構なインパクトだな。

①AmazonQuickSight

AWS Lambda

Amazon Kinesis Firehose

  • ストリーミングデータを直接S3/Redshiftへ。
  • Kinesis Stream→S3/Redshiftをアプリ無しで実現
    • EC2で転送アプリを書く必要がなくなった

Amazon Kinesis Analytics

  • ストリーミングデータをSQLで処理/分析
  • 処理結果をRedshiftやS3へ送信

Amazon Elasticsearch Service

  • AWSのマネージドサービス
  • Kibanaも使える
  • 自動スナップショット
  • CloudWatch Logs連携

AWS IoT

  • IoTで必要となるバックエンドの仕組み一式
  • 通信、セキュリティ、データのルーティングなどなど

今後、 SORACOMを使用した新たなサービス を提供します!とのお言葉。

プログラマブルなIoTプラットフォーム"SORACOM"】

司会が_%{color:red}「プログラマブル」%_ をひたすら噛むw

今日のお目当ての講演。
玉川さん、ドローンが好きすぎるが会社では飛行禁止されてる。

  • 基地局を借りて、パケット交換などの機能はすべてAWS上で構築。それがSORACOM。
  • 夜が安い、上りが安いなどIoT向けの従量課金体系です。
  • プログラマブル、ということでコマンドラインも作っています。
    • エンジニアがドヤ顔で「soracom sim terminate」→これ バルス やろ!w
      • 現在は解約の際にきちんと確認入るようになってます。

●事例紹介

  • フォトシンス
    • 鍵ロボット、Akerun RemoteでSORACOM Airの導入検証

●セキュリティの問題

  • docomoのデータセンターまでは安心
  • インターネット経由でサーバに行くのが危険。

ということで SORACOM Beam

  • クラウドの潤沢なリソースで暗号化/プロトコル変換すればいいじゃん
    • デバイスは非力なので、SORACOMでHTTP→HTTPSなどの変換
  • SIMのID、タイムスタンプを自動付加して、なりすましを難しく
  • SORACOM BeamもAPIでコントロールできます

…と思っていたら、AWS IoT!?

  • 大丈夫。機能にカブリは無い。むしろAWS IoTに直接接続できるメリットがある。

http://bit.ly/sora-iot

使えない

SORACOM Airが必要です

買ってね!!
のネタコンボ。

SORACOMのロゴは、

  • SORA=宇宙
  • COM=コミュニケーション
    をイメージしており、 一つ一つのSIMを星に見立てているそうです。