- アイディア番号
- @03949
アイデアボックスのCSVデータの改善:コメントデータの分離
- カテゴリー
- 0-1.デジタル社会に関する意見
- 寄稿者
- 矢野さとるさん
-
- 投稿日時
現在のアイデアボックスのCSVの構造は、「アイデア」と「コメント」が混合する等、データとして非常に再利用しづらいです。
また、コメント数の項目数が最大292件となっており、上限を超えた場合、データとしても不十分な構造となっています。
下記に改善案を示しますので、ご改善をお願いします。
https://ideabox.cio.go.jp/ja/csv_download/
◆現在のデータ構造:
"番号"
"投稿者"
"投稿日時"
"カテゴリー"
"タイトル"
"内容"
"ポイント"
"得票数"
"コメント数"
"URL",
"タグ1".."タグ11"
"コメント1".."コメント292"
※問題点1:コメントが292件以上ある場合、データに含まれず拡張性が不十分
※問題点2:コメント内の詳細なデータが含まれずデータとして不十分
◆改善案
1.「アイデアデータ」の構造:
"番号"
"投稿者"
"投稿者ID"
"投稿日時"
"カテゴリー"
"タイトル"
"内容"
"ポイント"
"得票数"
"コメント数"
"URL"
"タグ1~タグ11(タブで繋げる)"
2.「コメントデータ」の構造:
"親アイデア番号"
"投稿番号"
"投稿者"
"投稿者ID"
"投稿日時"
"内容"
"平均評価数"
※改善点1:
アイデアデータとコメントデータを親子構造で分離
※改善点2:
コメントがいくら増えても対応可能な為、拡張性がある
※改善点3:
コメント内の詳細なデータも取得できる為、AI解析など多様な活用が期待できる
以上、ご検討よろしくお願いいたします。