アイデアの問題報告 | デジタル改革アイデアボックス

あなたと創るデジタル社会

デジタル改革アイデアボックス


アイデアの問題報告

対象の内容

最高裁裁判所での判例は、PDFだけではなく、html,xml等の構造化データでも出してほしい

最高裁では、過去の判例を検索出来、公開もしている。その事自体はとてもよいことだと思っている。
しかし、公開されたデータがPDFのためそのデータを抜き出して利用しようとすると困難が伴う。

公開されたPDFを機械的に読み取る場合次のような困難がある。

- 判決には、「主文」「理由」など構造化された文章になっているのでそれを機械的に読み取れない。
- 改行ではなく、紙面の終わりで改行されてしまう。

こちらの記事で、実際にどのような困難があるかを記載した。

https://qiita.com/shiba...ms/4dcdbee5a848f31c1fab


裁判情報を公開していただけるのはとてもありがたいが、できればPDFだけではなく、htmlやxml等またはjsonなど構造をもったデータとして公開していただけると更にありがたい。

報告/依頼内容
ページの先頭へ