地図よもやま話
地図よもやま話TOPへ 第23話へ  

第23話 アドレスマッチング(続)

水田課長 毎日暑いなぁ、まったく死にそうだぜ。神は我々に試練を与えたもうたか。
中山由美 そんな大げさな・・
安村主任 さて、ではアドレスマッチングの続きの話を与えたもいましょう。
水田課長 お、お、おまえは鬼かぁ。
中山由美 そんな大げさな・・
安村主任 アドレスマッチングが難しい理由として前回日本の住所体系のややこしさを挙げましたが、次の理由として日本語そのものの難しさがあります。
水田課長 あん?
中山由美 例えば、英語は文章も住所の表記もword毎に区切られていますよね。でも、日本語は区切られてないですよね。だから、「すもももももももものうち」なんて言われるとどこが区切りが分からなくて苦労します。同様に住所も区切りなくつながってますからどこが区切りかわかりにくい。
水田課長 都道府県や市区町村で区切れるじゃん。住所にそういう県とか市とかいう文字が出てくれば区切ればいいじゃんか。
中山由美 でも、例えば四日市という市がありますが、「市」という文字が出てきたら区切るという話だと、四日という市になってしまいます。
水田課長 四日市は四日市市やんけ。
中山由美 それは課長が常識人で、四日市という市があることを常識として知っているからですよ。
安村主任 課長が常識人というのは疑問が残るが・・・
水田課長 では、市が二つ重なる時は後ろの「市」で区切るというルールにしたらどうだ。
中山由美 でも、大阪に河内長野という市があってそこに市町という地名があります。続けて書くと河内長野市市町となって、後ろの「市」で区切ると間違いになってしまいます。他にも、廿日市町とか原町市とか混乱しそうなのがあります。
水田課長 よくそんなん見つけてくるな。
中山由美 別に好きで見つけてるわけじゃないですよ。
水田課長 そうだ!英語みたいに住所の区切りの所で分かち書きしてもらえばいいじゃん。
安村主任 でも、既に自治体や企業に大量の住所データが蓄積されているわけで、それを今さら分かち書きするのは大変ですよ。
水田課長 そうか。分かち馬鹿よねーーーー。お馬鹿さんよねーーーー。
中山由美 ????
安村主任 昔、そういう歌があったんだよ。もちろん「分かち」じゃなくて「私」だけど。
水田課長 和菓子と洋菓子はどちらが馬鹿か知ってるか?
中山由美 ????
安村主任 察しが悪いなぁ。和菓子馬鹿よねーーーー。
水田課長 しかし、だいたい都道府県、市区町村、町丁目、地番、号番という順番で来るんだからなんとかなりそうなもんだがなぁ。
安村主任 いぇ。それがそうでもないんです。
水田課長 はぁ?
中山由美 例えば、龍ヶ崎市役所は、龍ヶ崎市3710番地にあります。
水田課長 へ?普通、大字○○とか間に入るよな。なんでそんな事になるねん。
安村主任 まあ、地名というのはそんな機械的、規則的に決まるものじゃないということですよ。逆にそれが地名の良さでもあると思います。
水田課長 ふむ。 なかなかいいこと言うやんけ。そういえば、京都の地名なんてなかなかいいよね。
中山由美 そうですね。でも、京都はまた難しいんですよ。
水田課長 え?何が?
中山由美 京都は、たとえば、烏丸通り七条下ルなんていう住所表記をしますよね。
水田課長 いいねぇ、風情があるよね、こういう表記は。それに京都を知っている人なら、だいたいこの辺だとすぐに見当がつくぞ。
安村主任 そうなんですけど、アドレスマッチングは建物まで特定したいので下ルでは分からないんですよね。そもそも、通常の住所体系は土地に対してつけられていますが、京都の表記は通りをベースにした表記で発想がちがうんです。
水田課長 う〜ん。頭が痛くなってきた。
中山由美 まだ問題があるんですけど。
水田課長 ええっ。
中山由美 そもそもアドレスマッチングは例えば、企業の顧客DBの住所から座標を求める処理なのですが、大もとの住所データが正しく記入されているかどうかが問題なんです。
水田課長 住所ってそんなに間違うものなのか?
安村主任 私は以前に1/500の地図から1/5000の地図を合成して作る研究をしていたのですが、その時に地図上に同じ住所表記が複数ある時は、一つだけ残して他は消すという処理をやってました。で、霞ヶ関のあたりの合成結果を見ると消されずに複数残っている表記がある。
水田課長 なんで?
安村主任 で、原因を調べてみると、霞ヶ関が、「霞ケ関」、「霞ケ関」、「霞が関」という風にバラバラに表記されていて、同じものという認識が出来なかったのです。
水田課長 う〜ん。入力時に正しい入力をしないといけないということだな。もしかして、1丁目7番11号を1-7-11なんて入力するとまずいのか?
安村主任 それは最近は認識できるようになりました。でも、特に顧客DBなどは、顧客が記入したデータをそのまま入力することが多いので、表記が正しくないことはおおいにありえます。
水田課長 お客さんだって、そんなこと気にせずに記入するよなぁ。
中山由美 それに、市区町村の合併などがあった時に、住所データが変更されず前のままになっていたりするとやっぱりまずいですよね。
水田課長 がーーーーん。 ああ、もう疲れた。聞きたくない。
中山由美 課長!へこたれないで下さい。
水田課長 なにぃ?課長、屁をタレないで下さいだとぉ。失礼な。
中山由美 もおーーー。お下品ですね。
水田課長 だって、そう聞こえたんだもん。
安村主任 しかし、一字違うだけでとんでもなく意味が変わってしまうんですねぇ。すごいですねぇ。
水田課長 何を感心してんねん。
第24話へつづく  
Copyright(C) 2004 IRI-Ubiteq Inc. All Rights Reserved.