Skip to content

Comments

町字エンドポイントの丁目が全角数字の場合に漢数字に置換#12

Merged
sanak merged 4 commits intogeolonia:nextfrom
sanak:11-replace-chome-number2kanji
Sep 12, 2025
Merged

町字エンドポイントの丁目が全角数字の場合に漢数字に置換#12
sanak merged 4 commits intogeolonia:nextfrom
sanak:11-replace-chome-number2kanji

Conversation

@sanak
Copy link
Member

@sanak sanak commented Jun 26, 2025

#11 に対する修正となります。

2025/06/26時点のデジタル庁のアドレス・ベース・レジストリの町字マスターの chome 列の値は、以下のように漢数字と全角数字が混ざる形となっていたため、丁(目)の前が全角数字の場合のみ、漢数字に置き換える処理を行いました。

お手すきの際に確認頂けますと幸いです。🙇

2025/06/26時点の町字マスター chome列全パターン
chome
一丁
一丁目
七丁目
三丁
三丁目
九丁目
二丁
二丁目
二十一丁目
二十丁目
二十二丁目
五丁目
八丁目
六丁目
十一丁目
十丁目
十七丁目
十三丁目
十九丁目
十二丁目
十五丁目
十八丁目
十六丁目
十四丁目
四丁
四丁目
1丁
1丁目
10丁
10丁目
11丁目
12丁目
13丁目
14丁目
15丁目
16丁目
17丁目
18丁目
19丁目
2丁
2丁目
20丁目
21丁目
22丁目
23丁目
24丁目
25丁目
26丁目
27丁目
28丁目
29丁目
3丁
3丁目
30丁目
31丁目
32丁目
33丁目
34丁目
35丁目
36丁目
37丁目
38丁目
39丁目
4丁
4丁目
40丁目
41丁目
42丁目
5丁
5丁目
6丁
6丁目
7丁
7丁目
8丁
8丁目
9丁
9丁目
(参考) 2024/04/18時点の町字マスター chome列全パターン
chome
一丁
一丁目
七丁
七丁目
三丁
三丁目
三十一丁目
三十丁目
三十七丁目
三十三丁目
三十九丁目
三十二丁目
三十五丁目
三十八丁目
三十六丁目
三十四丁目
九丁
九丁目
二丁
二丁目
二十一丁目
二十丁目
二十七丁目
二十三丁目
二十九丁目
二十二丁目
二十五丁目
二十八丁目
二十六丁目
二十四丁目
五丁
五丁目
八丁
八丁目
六丁
六丁目
十一丁目
十丁
十丁目
十七丁目
十三丁目
十九丁目
十二丁目
十五丁目
十八丁目
十六丁目
十四丁目
四丁
四丁目
四十一丁目
四十丁目
四十二丁目
(補足) duckdbでの上記パターン出力メモ
brew install duckdb
duckdb
-- mt_town_all.csv の読み込み
CREATE OR REPLACE TABLE mt_town_all AS
  SELECT * FROM read_csv_auto(
    'mt_town_all.csv',
    delim=',',
    header=True
  );

-- chome列の重複を除去してCSVにエクスポート
COPY (
  SELECT DISTINCT(chome) AS chome
    FROM mt_town_all
    ORDER BY chome
) TO 'chome.csv' (HEADER, DELIMITER ',');

Closes #11

@sanak sanak self-assigned this Jun 26, 2025
@sanak sanak marked this pull request as draft June 26, 2025 02:16
@sanak sanak marked this pull request as draft June 26, 2025 02:16
@sanak
Copy link
Member Author

sanak commented Jun 26, 2025

申し訳ございません、 {市区町村名}.json, {市区町村名}-住居表示.txt の方は丁目が漢数字に変換できていましたが、 {市区町村名}-地番.txt の方の丁目が全角数字のままとなっておりました...。 💦

引き続き、対応の方を進めます。 🙇

@sanak
Copy link
Member Author

sanak commented Jun 26, 2025

申し訳ございません、 {市区町村名}.json, {市区町村名}-住居表示.txt の方は丁目が漢数字に変換できていましたが、 {市区町村名}-地番.txt の方の丁目が全角数字のままとなっておりました...。 💦

引き続き、対応の方を進めます。 🙇

上記ですが、住居表示の方に入っている以下の町字のフォーマット処理が、
https://github.com/geolonia/japanese-addresses-v2/blob/main/src/processes/03_make_rsdt.ts#L214-L217
https://github.com/geolonia/japanese-addresses-v2/blob/main/src/processes/03_make_rsdt.ts#L241-L244

    apiData.push({
      machiAza: rawToMachiAza(currentMachiAza),
      rsdts: currentRsdtList,
    });

地番の方には入っていないのが原因のようでした。
https://github.com/geolonia/japanese-addresses-v2/blob/main/src/processes/04_make_chiban.ts#L166-L169
https://github.com/geolonia/japanese-addresses-v2/blob/main/src/processes/04_make_chiban.ts#L185-L188

        apiData.push({
          machiAza: currentMachiAza,
          chibans: currentChibanList,
        });

以下のコミットで対応し、手元の環境で {市区町村名}-地番.txt の丁目も漢数字となっていることを確認できましたので、お手すきの際に再度確認をお願いいたします。
コミット差分: 9369f6d

           apiData.push({
-            machiAza: currentMachiAza,
+            machiAza: rawToMachiAza(currentMachiAza),
             chibans: currentChibanList,
           });

@sanak sanak marked this pull request as ready for review June 26, 2025 03:07
@sanak
Copy link
Member Author

sanak commented Jun 26, 2025

PR #14 がこちらの内容を含んでいますが、全角数字=>漢数字への変換に関してはこちらに記載していますので、一旦、Draft(下書き)モードとさせて頂きます。🙇
=> 6/28追記: PR #14 の対応に時間がかかりそうなため、こちらのDraftモードを解除しました。🙇
=> 7/9追記: TODOテストコードの追加 (10丁, 39丁目 など)

@sanak sanak marked this pull request as draft June 26, 2025 08:23
@sanak sanak marked this pull request as ready for review June 28, 2025 13:15
@sanak
Copy link
Member Author

sanak commented Jul 15, 2025

こちらですが、自治体側で丁目に漢数字でなく算用数字を用いる場合があるということでしたので、クローズします。
(なお、町字エンドポイントについては、国土数値情報-位置参照情報(大字・町丁目レベル)を補助的に利用していて、そちらは引き続き漢数字を利用していますので、データ比較時に重複などが発生しないよう、別途起票して対応するようにします。)

@sanak
Copy link
Member Author

sanak commented Sep 2, 2025

再検討のため、リオープンします。

@sanak sanak reopened this Sep 2, 2025
@sanak sanak requested a review from bougan1160 September 11, 2025 23:15
@sanak
Copy link
Member Author

sanak commented Sep 11, 2025

@bougan1160 @naogify
以下のコミットでテストコードも追加しましたので、確認をお願いいたします。
(2025/09/12時点で、ABRの町字マスターの丁目の数値の最大は42となってました(chome.csv)ので、丁目の数値が50以上のパターンは追加していません。)
4f7de9f

@sanak sanak changed the base branch from main to next September 12, 2025 06:15
@sanak
Copy link
Member Author

sanak commented Sep 12, 2025

他で急ぎ目で必要な対応(#17)もあり、一旦 next ブランチ向けでマージします。

@sanak sanak merged commit 2f79d6c into geolonia:next Sep 12, 2025
1 check passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

町字エンドポイントのJSONで、◯丁目(chome)の数値部分が漢数字でなく全角数字となる

1 participant