EDINET・TDnetともに公式サイトからZip形式で XBRL形式で、データのダウンロードが可能だ。
・EDINET EDINETの書類検索画面から 検索条件を入力し、
検索結果でXBRLボタンをクリック
・TDnet 適時開示情報閲覧サービス画面 からXBRLボタンをクリック
(ともに XBRLがある場合のみXBRLボタンが表示される。)
しかし、一旦手動でダウンロードした後、財務が見え~るへの取り込みを行う必要があり、操作が面倒になることから、公式サイトから直接処理することは断念し、(有)プレシスが提供しているウェブサービス有報キャッチャーを利用して会話型のソフトを実現することにした。
※ EDINETで公開されているダウンロード機能
指定条件に合致している報告書の一括ダウンロードが可能。
さらにダウンロードしたXBRLから CSV形式に変換するアプリも公開されているので、目的によっては有用。
※ TDnetオリジナルの公開情報
情報開示日から一か月以内に限り閲覧可能。
有報キャッチャーは、公開データを独自に保存していると思われ、この期間制限はない。
※ (有)プレシスでは、無償で使用できるTeCAXという閲覧ソフトを提供しており、今回はこのソフトを参考にさせてもらいました。
有報キャッチャーを用いて取得可能なデータ
・EDINET 公式サイトでダウンロード可能なファイルと同じ
・TDnet 公式サイトでダウンロード可能なファイルと同じ
基本的には、XBRLファイルを解読すれば、財務が見え~るのデータが生成可能だが、トヨタ・ホンダ・ソフトバンク等、IFRSまたは米国基準でデータを公開している企業の場合、XBRLファイルには非連結分のデータのみで連結分のデータは含まれていない。
おそらく、xbrlそのものを解析したほうが、処理は単純化できると思うが、xbrlに比べhtmlの方がVolumeが小さいことから、ネットワークアクセスなども考えるとhtmを扱ったほうが処理時間は短縮できるように思う。
このことから、邪道かも知れないがhtmlファイルを解読し、財務が見え~る用データを生成することにした。
なお、EDINET・TDnetともに、2014年4月以降とそれ以前では開示データの形式が大幅に変わっていることから、2014年4月1日以降に開示されたデータのみを処理対象にした。