その他お問い合わせ先

lodestar@truestar.co.jp

運営会社

株式会社truestar
truestar activation株式会社

KPIダッシュボードサンプル改

4月19日のTableau Conference on Tour Tokyoにて
『ダッシュボードデザインの基本』
というテーマで登壇させていただきました。

その中で、KPIダッシュボードのビフォーアフターをご紹介しましたので、ファイルをTableau Publicで共有しました。

簡単な説明とともにご紹介。

 

Tableau-id上で、2014年8月にKPIダッシュボードサンプルという記事を書きましたが、
そこで公開したダッシュボードを『ビフォー』として、
デザイン観点(フォント・色・レイアウト)を意識して簡易に修正した『アフター』版、さらに
コンテンツ観点(目的・情報整理・適切な可視化方法)まで加味した『アフターのアフター』版を作りました。

まず、これが『ビフォー』(※2017/04/21 誤って別のファイルを上書き保存してしまったのでver10.1で上げ直しました・・・)

なかなか色がうるさいですね。無駄な枠線などもあります。数値も小さく見づらいです。

 

フォント、色、レイアウトを簡易に調整した『アフター』がこちら。

フォントサイズ差での強調、色数の抑制、レイアウトを揃えなど、簡易な修正でシンプルで見やすいダッシュボードに修正したものです。
難しいスキルは必要なく、デザインの基本を抑えるだけでこのくらいには誰にでも簡単に作れると思います。

ちなみにフォントは『Tableau Book』です。
カンファレンスでも話しましたが、『メイリオ』などの日本語フォントはMacやiOSでの表示を制御できないのでオンライン展開する場合には、欧米フォントの『Tableau Book』等を使って、閲覧環境に委ねるという選択もあります。
標準的な環境ならば、MacとiOSでは日本語は『ヒラギノ角ゴシック』に、WinのChromeでは『メイリオ』になると思います。たしかIEだと『MSゴシック』とかで微妙でしたが・・・

また、Windows上のTableau DesktopやReaderだと、MS UI Gothicだったと思うので、iPadとかで見るようなニーズがなく、Windows環境メインなら『Tableau Book』フォントよりも『メイリオ』がシンプルで見やすいと思います。

 

さて、『ビフォー』版も『アフター』版も、そもそも掲載情報がモリモリなので、コンテンツを減らしつつ、Tableauのアクション機能によるページ遷移なども加えた『アフターのアフター』版がこちら。

先述の2つバージョンからは表示している情報数も内容も異なるので直接的には比較しづらいですが、コンテンツのボリュームや配置を調整することでより見やすくまとまっているかと思います。
気になった情報をクリックして詳細情報へページ遷移したり、絞込みができるのもTableauの良いところですね。

 

ちなみに、何をどう配置するかは、ダッシュボードのそもそもの目的・役割・用途による部分で、最も重要なポイントです。
今回はデザインの話にフォーカスを当てているため、そこには触れませんが、デザイン以前に『ダッシュボードの5W1H』をきちんと詰めておくことをオススメします。

■ダッシュボードの5W1H
Why そもそもの可視化目的は?
What 何を見る?
Who 誰が見る?
When いつ見る?
Where どこで見る?
How どうやって見る?

これらが定まっていないと、特にコンテンツ観点(目的・情報整理・適切な可視化方法)でのデザイン構成が固まらず、効果的な可視化は難しいと思います。

 

T.Fuji

p.s.
『ビフォー』版と『アフター』版の折れ線グラフでは在庫数を単純なSumで計算していますが、通常は月間の数値を四半期に足し上げて見るような数値ではないので厳密にはおかしいですね・・・失礼しました。
また、コーヒーチェーンのデータ(確か昔はTableauのデフォルトのサンプルデータだったはず・・・)だと当年と前年の数値がまったく同じで折れ線が重なるので、『アフターのアフター』版では計算フィールドでダミーデータを作って表示しています。念のため。

Tableau本

3月末にTableauユーザー会メンバーが執筆した

『Tableau データ分析 ~入門から実践まで~』

が刊行されました。

ユーザー会のつながりで一部コンテンツの査読にも関わりましたが非常に濃密な内容です。

前半の基本機能の説明ではユーザー視点で引っかかるポイントが丁寧に記載されています。特にところどころに出現するColumnやNoteには公式マニュアルには載らないものの知っておきたいテクニックなどが多数盛り込まれています。

中盤にはデータ分析プロジェクトの進め方等に関する記述がありますが、ここはまさに弊社のプロジェクトの中でも日々感じていることが体系的に整理されており、仮にTableauユーザーでなくても有益なコンテンツです。社内向けの企画書作成などでも役立つシーンは多いと思います。

後半の応用編は、実践的なデータ分析の手法が丁寧に書かれています。2014年に当ブログに投稿したRFM分析も当時は一度集計結果を元データから切り離す必要がありましたが、いまではこの本に記載のあるように、LOD関数で実現するようになりました。

最後のユーザー事例では、導入経緯や社内での取り組み方だけでなく、Tableauの足らない点などにも切り込んでいたりと、このあたりはユーザー本ならではですね。

これから本格的にTableauを使いたい、という方には特にオススメの一冊です。

amazonで買う

楽天で買う

ページ数なんと700ページ超の超大作ですが、硬さのないソフトカバーなので手元で楽に扱えます。


※タバコを吸わないので500円玉と比較してみました。

P727にはおすすめサイトとして Tableau-id も掲載いただきました。
ありがとうございました。

T.Fuji

マリメッコチャート(Marimekko chart)を作成してみる

Tableau10.0で実装された「連続軸マークのサイズ変更」の機能を使って、マリメッコチャートと呼ばれる図を作ってみました。

マリメッコチャートを使うと、全体の量と内訳を視覚的に捉えることができます。

2軸を1つのグラフでまとめて見られる点が積上げ棒グラフとの違いです。

今回はスーパーストアのデータを使用しました。

横軸がセグメント(地域ごとの売上の大きさに合わせた幅を持つ)、縦軸が地域内のカテゴリシェアを表しています。
 

 
作成方法を順を追って説明します。

 

1.「売上」を行に配置し、地域、カテゴリで色分け

2.計算フィールドの作成

3.列に作成した「積上売上」を配置し、以下の設定で計算

 

4.「売上」の計算を合計に対する割合に変更、「カテゴリ」を使用して計算に変更

5.「列ごとの売上」をサイズに指定、サイズを固定、軸の単位の幅を「列ごとの売上」、配置を右に変更

6.ラベルなど細部を整えて完成

 

連続軸マークのサイズ変更ができるようになることで何ができるようになるのかな、

と調べてみてたところ、マリメッコチャートが作れそうとのことだったので作ってみました。

使いどころは難しそうですがこんなこともできるようになりましたよ、ということで。

 

Tableau_id執筆者:林 周作(Shuusaku Hayashi)

書式設定の仕様について(10.0)

10.0からワークブック全体で一括して書式設定できるようになりましたね。

書式設定1

今回は書式設定全般で何が優先されるかといった仕様について確認してみます。

まずはワークブック書式設定の機能を確認してみます。
書式設定2

・すべて
ワークブックの全書式設定の一括変更

・ワークシート
・ツールヒント
・ワークシートのタイトル
・ダッシュボードのタイトル
・ストーリーのタイトル
各オブジェクト単位の書式設定の一括変更

・既定にリセット
Tableau既定の値に変更される
※変更されたものは灰色のマークが表示され、マークをクリックすると個別にリセットできる

次に書式設定の優先順位を確認してみます。

1)設定変更時の優先順位
後から設定変更したものが優先される。
例)
1.ワークブックの書式設定>すべて
2.ダッシュボードの書式設定>ダッシュボードのタイトル
の順で設定変更した場合は2が優先
2.ダッシュボードの書式設定>ダッシュボードのタイトル
1.ワークブックの書式設定>すべて
の順で設定変更した場合は1が優先
※ワークブックの書式設定>すべて を指定すると、個別の設定がすべて変更される

2)「既定にリセット」「クリア」の優先順位
下記の階層に従い、ひとつ上の階層の設定に変更される
※下の階層で個別に設定していた場合はそのまま設定が残る
Tableau既定
└ ワークブック(すべて)
├ ワークシート
│ └ 個別のワークシート
├ ツールヒント
│ └ 個別のツールヒント
├ ワークシートのタイトル
│ └ 個別のワークシートのタイトル
├ ダッシュボードのタイトル
│ └ 個別のダッシュボードのタイトル
└ ストーリーのタイトル
│ └ 個別のストーリーのタイトル
└ 個別の設定(テキストオブジェクトなど)
例)
1.ワークブック(すべて)で「メイリオ」に設定
2.ダッシュボードの書式設定>ダッシュボードのタイトル で「MS明朝」に設定
3.個別のダッシュボードでタイトルを「MSゴシック」に設定
この場合、
・個別のダッシュボードで書式設定→「クリア」→「MS明朝」に戻る
・ワークブックの書式設定→ダッシュボードのタイトル で「既定にリセット」(灰色のマーク)→「メイリオ」に戻る
※この段階では個別のダッシュボードは「MSゴシック」のまま
・ワークブックの書式設定→ダッシュボードのタイトル で「既定にリセット」→個別のダッシュボードで書式設定→「クリア」→「メイリオ」に戻る

まとめ
初期設定としてデフォルト設定を行えるようになった点は便利ですね。
ワークシートやダッシュボードを新しく作成するたびに、設定を変更していたので効率化に繋がりそうです。
ただ、設定変更時の優先順位と「既定にリセット」「クリア」の優先順位の挙動が異なる点と、
個別にフォントサイズを指定していたりしてもワークブックの書式設定からサイズを変更すると全て変わってしまう点は注意が必要です。

Tableau_id執筆者:林 周作(Shuusaku Hayashi)

ハイライター(Highlighter)について

今回は今更ですが、Tableau10.0の新機能のハイライターの使い方について考えてみます。

私も模索中ですが、「どうやって使えるんだろう」「何に使えるんだろう」といったことを考える上での参考になれば幸いです。
使用するデータソースはいつも通りサンプルスーパーストアです。

 

使い方は簡単で、ビューの中でしようしたディメンションをクリックして「ハイライトを表示」を選択するだけです。
現れたハイライターから「文字列検索」「プルダウン選択」が使用可能です。
細かい機能を見てみましょう。

文字列検索
ワイルドカード検索になっていて、候補から一つに選択しない限りマッチするもの全てをハイライトします。
ハイライター2

プルダウン選択
項目にカーソルを当てた時点でハイライトされます。
そこからマウスを動かしたり、キーボードで上下させたりするとハイライト項目が変ります。
ハイライター1

これまでもダッシュボードのアクションフィルタや、色からのハイライトが可能でした。
それ以外にもパラメータで指定したものをハイライトするようなテクニック(参考)もありましたが、
・手軽に使える点
・色の指定が必要ない点
・フィルタより処理が軽い点
や上記で示したような機能が大きな特徴となっています。

また、既存の機能でハイライト時に処理を行うものがありますが、
ハイライターと組み合わせることでも色々と可能性が広がりそうです。

例えば、
・ラベル設定の「ハイライト時のみ」
・傾向線やリファレンスラインの「ハイライト時に再計算」
が挙げられます。

これらのギミックを入れながら簡単なダッシュボードを作成して見ました。

欲を言えばダッシュボード内にリストをスクロールする形で表示する場合にハイライトを当てたらそこまでスクロールしてくれると最高ですが・・・
複数にハイライトがあたっている時の処理が難しいのかもしれませんね。
ハイライト対象が単一行の場合にスクロール可能になるよう改善を期待したいところです。

Tableau_id執筆者:林 周作(Shuusaku Hayashi)

細分化されたAlteryxワークフローを一度に回してくれるRunnerマクロを使ってみた #Alteryx #20 | Alteryx Advent Calendar 2016

『Alteryx Advent Calendar 2016』スポット参戦シリーズ第六弾です。

Alteryx Advent Calendar 2016 | シリーズ | Developers.IO

Alteryx Advent Calendar 2016 – Qiita

20日目のエントリとして細分化されたAlteryxワークフローを一度に回してくれるRunnerマクロを使ってみたいと思います。

14日目16日目のエントリにて、調査データをAlteryxで加工してみましたが、調査データをAlteryxで加工すると時に、たとえば、特定質問でYesと答えた回答者で回答率を算出したり、移動平均を算出したりするという加工を入れると、Alteryxワークフローが非常に大きくなってしまうことがあります。

そうなってしまうと、たとえばロジックの改修を行う際に、毎回大きなワークフローを回す必要が出たり、またエラーが出た際に原因を特定するために、大きなワークフローを回す必要が出たりと、ワークフローが回るまでの待機時間が長くなってしまいます。

また、複雑な集計処理をしていなくても、データ量が膨大な場合、ワークフローが完全に回ってからでないと加工状況が見えないため、集計処理が正しいかを確認しようとするたびに、ワークフローを回すことになり、ワークフローが回るまでの待機時間が長くなってしまいます。

上記のような状況の場合、ワークフローを細分化するとワークフローが回るまでの待機時間が短縮されます。

しかし、定期運用をする必要があるデータの場合、毎回細分化されたワークフローをすべて回す必要があるため、更新に時間を費やしてしまうことになります。

これを解決するのが、今回紹介しますRunnerというツールとなります。

このツールは、Alteryxにデフォルトで入ってるツールではなく、Alteryxの社員であるAdam Rileyさんが任意で作成したマクロとなります。

※Alteryxユーザーであれば、任意でマクロを作って、それをネット上で共有することができます。

以下でAdam Rileyさん作成したマクロのパッケージを一括ダウンロードできます。

Adam Rileyさんマクロパッケージ

 

実際にRunnerを使ってみようかと思います。

まずは細分化した2つのAlteryxを用意しました。

1つ目はAlteryxで調査データをTableau用データに加工してみた-Part 1で使ったワークフローです。

survey_runner

2つ目はAlteryxで調査データをTableau用データに加工してみた-Part 2 #Alteryx #16 | Alteryx Advent Calendar 2016で使ったワークフローにさらに加工を加えたものです。

survey_runner2

次に、Runnerを使って、Alteryxワークフローを作成します。

Runnerで1つ目のワークフローを指定して、Conditional Runnerで2つ目のワークフローを指定します。

Conditional Runnerは何個もつなぐことができるので、細分化さらたワークフローがいくつあっても問題ありません。

runner

runner_explanation

上記のように設定して、ワークフローを回せば、細分化されたワークフローを順番に回してくれます。

Runnerを使う上で注意すべき点は、ワークフロー名、Inputデータ名、Outputデータ名に日本語が入っていると、エラーが出てしまい、正常に作動しない点です。

 

明日21日目はクラスメソッドさんのエントリです。乞うご期待!

Kazuki Koebisawa

 

Alteryxで調査データをTableau用データに加工してみた-Part 2 #Alteryx #16 | Alteryx Advent Calendar 2016

『Alteryx Advent Calendar 2016』スポット参戦シリーズ第五弾です。

Alteryx Advent Calendar 2016 | シリーズ | Developers.IO

Alteryx Advent Calendar 2016 – Qiita

16日目のエントリとして14日目のエントリのPart 2として、大量の調査データをAlteryxでTableau用データに加工してみたいと思います。

ちなみに14日目のPart 1エントリは以下です。

 

様々な国の調査データを比較したかったり、調査データをトラッキングしたいとなると大量の調査データを取り扱うことになります。

Part 1の形のデータベースとなると、データ粒度が回答者IDごとであり、尚且つTableau上では、表計算で回答率を算出するため、データが大きいとTableauのスピードが著しく悪くなります。

そのため、以下のAlteryxワークフローで大量の調査データにも対応できるTableau用データベースを作成してみました。

part2

 

以下でPart 2で追加したツールの詳細を説明します。

summary

 

このSummarizeを入れるだけで、25003行だったデータが、9008行まで収縮できました。約40%の収縮です。

完成したデータはこれです。

datapart2

 

明日17日目はクラスメソッドさんの『Communityの使い方 』です。乞うご期待!

Kazuki Koebisawa

Alteryxで調査データをTableau用データに加工してみた-Part 1 #Alteryx #14 | Alteryx Advent Calendar 2016

『Alteryx Advent Calendar 2016』スポット参戦シリーズ第四弾です。

Alteryx Advent Calendar 2016 | シリーズ | Developers.IO

Alteryx Advent Calendar 2016 – Qiita

 

14日目のエントリとしてクラスメソッドの川崎さんが以下のエントリでもご説明してくださっていますが、調査データをAlteryxで実際に加工してみようかと思います。

Tableau Conference 2016 at Austin [レポート]調査データを可視化する 2.0 – Data Revelations #data16

 

活用するデータは以下になります。

まずは、数値形式で格納されているデータです。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a35

 

次に、文字形式で格納されているデータです。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a32

上記、データがない場合もあるかもしれません。

その場合は、以下のようなマスターを作成することをおすすめします。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a34

 

最後に、質問の補足情報が格納されたデータです。

Tableauで加工する際に、必要になる情報です。

「Wording」は、Tableauで、質問の内容を表示するために使い、また、「Question grouping」は、TableauのView毎の単位となります。

このデータは、ほとんどの場合、手元にないと思いますので、同じようなものを作成することをおすすめします。

ただし、「Question Type」については、必須ではありません。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a33

 

これらのデータを活用し、以下AlteryxワークフローでTableau用データを作成しました。

非常に簡単なロジックとなっています。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3alteryx

 

以下でAlteryxワークフローのロジックを説明していきます。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3transposeptt

上記のようにTranspose設定し、Alteryxを回すと、データの形が以下のようになります。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3transafter

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3selectppt

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3nullppt

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3joinppt

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3joinppt

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3join2ppt

 

完成したTableau用データが以下となります。

横長であったデータがTransposeにより、Tableauが得意な縦型のデータになっています。

また、このような形であれば、Tableauで、デモグラである「Gender」「Location」「Generation」のフィルターをそれぞれの質問のViewに入れることができたり、複数の切り口でデータを見ることができます。

%e3%82%ad%e3%83%a3%e3%83%97%e3%83%81%e3%83%a3comp

 

明日15日目はクラスメソッドさんの『Alteryxをさわってみた 』です。乞うご期待!

Kazuki Koebisawa

ポイントデータ(緯度経度)データをポリゴンデータに紐付けてみる #Alteryx #09 | Alteryx

『Alteryx Advent Calendar 2016』スポット参戦シリーズ第三弾です。

Alteryx Advent Calendar 2016 | シリーズ | Developers.IO

Alteryx Advent Calendar 2016 – Qiita

 

09日目のエントリとしてAlteryxを用いてポイントデータにポリゴンデータを紐付けてみます。

 

例によってデータは国土数値情報さんから取得します。

国土数値情報

 

今回は、医療機関データ(ポイントデータ)に

tableauid20161209-01

 

医療圏データ(ポリゴン)を使ってみましょう。

 

tableauid20161209-02

 

具体的には、医療機関データには病院などの施設名に住所と位置情報が含まれます。

一方、医療圏データには、病床の整備のために設定された地域領域が含まれます。

参考資料:wikipedia 医療計画

 

医療圏データは、3種類のポリゴン(一次医療圏、二次医療圏、三次医療圏)が含まれていますが、

今回は、医療機関に対して二次医療圏を紐付けてみましょう。

tableauid20161209-03

 

完成形のモジュールは以下の通りです。いたってシンプル。

tableauid20161209-04

 

左半分の設定内容です。

tableauid20161209-16

今回はシェープファイルの文字化けが発生しました。

シェープファイルの読み込み時は文字コードの指定ができないので、[ConvertFromCodePage]ツールでの変換を最初に行っています。

[Spatial Match]では、施設のデータに対して、施設の位置が含まれる医療圏ポリゴンを紐付けています。

紐づかなかったデータはU側にはじかれます。14件ほどはじかれてしまいました。

海に近い施設がポリゴンに含まれなかったり、ポイントデータにも不備がありそうです。

大分県の5施設は海上にプロットされました・・・

tableauid20161209-18

Alteryxの[Browse]ツールを使うだけで、エラーも簡単に可視化できます。

このあたりの異常値は本来メンテナンスが必要ですが、今回の趣旨とは外れるのでそこには触れずに進めます。

 

右半分の設定内容です。

tableauid20161209-17

こちらでは、Tableauでの可視化に向けた加工を行っています。

施設Pointは空間情報になり、いまのTableauでは読み込めません。(次のバージョンでは読み込める見込)

空間情報から緯度経度をそれぞれ取得して、Tableauで読めるようにします。

緯度経度を取得した後は、空間情報はカットします。(重いので)

また、所在地だけだと使いづらいので、都道府県のカラムも追加しておきます。

あとはTDEで吐き出して終了です。

 

約18万件の施設の位置情報に、約7万件の医療圏のポリゴン(元データにおいて、飛び地は別レコードになっているためレコードが多い模様)をマッチングさせていますが、わずか20秒弱で完了です。
(※私のラップトップPCには12GBのメモリが積まれているため、一般に使われるものと比べるとかなり高スペックな部類ですが・・・)

tableauid20161209-05

 

と言うわけで、Tableauでこんな感じになりました。


※2016/12/13 表示サイズがおかしくなっていたので修正
 

明日10日目はクラスメソッド大矢さんの『マーケット・バスケット分析をやってみた』です。乞うご期待!

 

T.Fuji

API経由で住所データをジオコーディングしてみる #Alteryx #08 | Alteryx Advent Calendar 2016

『Alteryx Advent Calendar 2016』スポット参戦シリーズ第二弾です。

Alteryx Advent Calendar 2016 | シリーズ | Developers.IO

Alteryx Advent Calendar 2016 – Qiita

 

08日目のエントリとしてAlteryxを用いてYahooのAPIと連携し、ジオコーディングを行ってみます。

 

まず、YahooのAPIと連携するためには、Yahoo! デベロッパーネットワークでアプリケーションIDを取得する必要があります。

さすがはYahoo! Japanさん。分かりやすいヘルプがあるので、こちらのページを参考に簡単に取得可能です。

Yahoo!デベロッパーネットワークヘルプ

なお、ジオコーディングにはYahoo! ジオコーダAPIを用います。

Yahoo! ジオコーダAPI

 

今回、ジオコーディングの対象住所には、『住所一覧』でググったら上位に出てきた大阪府の公立小学校のデータを用いることにしました。

tableauid20161208-1

エクセルを開くとこんな感じです。データ取得上は不要となるタイトルがついています・・・。

tableauid20161208-2

しかも・・・実際には後で気づきましたが、下のほうにも別のテーブルがありました。

tableauid20161208-3

APIでジオコーディングする前に、これらの不要なデータをAlteryxで処理する必要がありそうです。

 

さて、実際のモジュールですが、結論から言うと最終形はこんな感じです。

tableauid20161208-4

意外と小さなモジュールで済みました。

 

上半分と下半分に分けて細かく見ていきます。

tableauid20161208-4-18

最初に元データとなるエクセルファイルを読み込み、不要なデータを順に取り除いています。
二連続となる[Filter]ツールでは、もう一つのテーブルとのカラム名の列と、テーブルとテーブルの間の空白をカットするために用いています。
右端にある[Formula]ツールで、APIに投げ込むURLデータを生成しています。

続いて下半分です。

tableauid20161208-4-19

API経由でのデータダウンロードに始まり、JSONデータを分解、縦持ちデータを横持ちに変更します。
次にJSON形式で取得した緯度経度はカンマ区切りで一つのカラムに入ってしまっているため、[Formula]ツールで切り分けます。

YahooのジオコーダAPIは番地レベルで厳密にヒットしないと変換されず、Nullで返ってきます。
今回は995レコード中27レコードがはじかれてしまいました。
それらがすぐに判別できるよう変換判定のフラグを立た上で、データのソートまでこのフローに組み込んでいます。

なお、今回は大阪府が発表している公共施設のデータなのでヒット率が高かったのですが、個人の住所データや手入力の住所情報等の場合、エラーが多く出力されることになります。
GoogleのAPIだと厳密にヒットしなくても近しい住所データにマッチングしたり、複数候補を挙げてくれたりするのですが、GoogleはAPIの制限が厳しく、無償で大量のデータを処理することも難しいため、ここではYahooのAPIを使用しました。

さて、今回はExcelでアウトプットしてみましたが、例によってTableauにつなげて可視化してみるとこんな感じです。

tableauid20161208-4-20

市区町村などのカラムがないので、ワイルドカード照合で絞り込みが効果的です。
ちなみに矢印のついている大阪市立友渕小学校は我が母校です。

 

明日9日目は『住所データを都道府県と市区郡町村に分割してみる』を連続投稿予定です。

明日9日目は『ポイントデータ(緯度経度)データをポリゴンデータに紐付けてみる』です。※2016/12/08 修正

 

T.Fuji