最高裁裁判所での判例は、PDFだけではなく、html,xml等の構造化データでも出してほしい by 芝尾幸一郎さん | デジタル改革アイデアボックス

あなたと創るデジタル社会

デジタル改革アイデアボックス


アイデア番号
@04730

最高裁裁判所での判例は、PDFだけではなく、html,xml等の構造化データでも出してほしい

カテゴリー
0-1.デジタル社会に関する意見
寄稿者
芝尾幸一郎さん
投稿日時
コメント数
3コメント
評価P
20ポイント

最高裁では、過去の判例を検索出来、公開もしている。その事自体はとてもよいことだと思っている。
しかし、公開されたデータがPDFのためそのデータを抜き出して利用しようとすると困難が伴う。

公開されたPDFを機械的に読み取る場合次のような困難がある。

- 判決には、「主文」「理由」など構造化された文章になっているのでそれを機械的に読み取れない。
- 改行ではなく、紙面の終わりで改行されてしまう。

こちらの記事で、実際にどのような困難があるかを記載した。

https://qiita.com/shiba...ms/4dcdbee5a848f31c1fab


裁判情報を公開していただけるのはとてもありがたいが、できればPDFだけではなく、htmlやxml等またはjsonなど構造をもったデータとして公開していただけると更にありがたい。

ページの先頭へ