電子データに使用可能な文字の一覧はテキストファイルで提供を by ZZOさん | デジタル改革アイデアボックス

あなたと創るデジタル社会

デジタル改革アイデアボックス


アイデア番号
@00126

電子データに使用可能な文字の一覧はテキストファイルで提供を

カテゴリー
0-1.デジタル社会に関する意見
寄稿者
ZZOさん
投稿日時
コメント数
1コメント
評価P
6ポイント

e-Taxで使用可能な文字の一覧。
https://www.e-tax.nta.g...etsuzuki/tetsuzuki7.htm
eLTAXで使用可能な文字の一覧。
https://www.eltax.lta.go.jp/eltax/chuuijikou/moji/
使用可能な文字の一覧は上記からのみ入手できるようだが、これは「人間が見るための文書」である。
プログラムに「文字チェック」を組み込むにはこのPDFファイルから1文字1文字を人間の手で切り取ってプログラムなどへ埋め込む必要があるが、このような作業では人間は必ずミスをする。
このPDFを作るにあたって利用可能な文字コードの一覧が存在したはずなので、それをテキストファイルとして公開するべき。
数千字をPDFから抽出するには時間の無駄以外の何物でも無い。
また、「PDFは表示・印刷用フォーマット」であり「PDFから文字データを抽出させるのは間違っている」という認識をシステムの設計・開発者が持つべき。持たせるべきである。

ページの先頭へ