EDINET・TDnet to 財務が見え~る
その3 機械的に財務データを取得するには?

EDINETTDnetともに公式サイトからZip形式で XBRL形式で、データのダウンロードが可能だ。

EDINET EDINETの書類検索画面から 検索条件を入力し、
検索結果でXBRLボタンをクリック
TDnet 適時開示情報閲覧サービス画面 からXBRLボタンをクリック

(ともに XBRLがある場合のみXBRLボタンが表示される。)

しかし、一旦手動でダウンロードした後、財務が見え~るへの取り込みを行う必要があり、操作が面倒になることから、公式サイトから直接処理することは断念し、(有)プレシスが提供しているウェブサービス有報キャッチャーを利用して会話型のソフトを実現することにした。

※ EDINETで公開されているダウンロード機能
指定条件に合致している報告書の一括ダウンロードが可能。
さらにダウンロードしたXBRLから CSV形式に変換するアプリも公開されているので、目的によっては有用。

※ TDnetオリジナルの公開情報
情報開示日から一か月以内に限り閲覧可能。
有報キャッチャーは、公開データを独自に保存していると思われ、この期間制限はない。

※ (有)プレシスでは、無償で使用できるTeCAXという閲覧ソフトを提供しており、今回はこのソフトを参考にさせてもらいました。


有報キャッチャーを用いて取得可能なデータ

EDINET 公式サイトでダウンロード可能なファイルと同じ
TDnet  公式サイトでダウンロード可能なファイルと同じ

基本的には、XBRLファイルを解読すれば、財務が見え~るのデータが生成可能だが、トヨタ・ホンダ・ソフトバンク等、IFRSまたは米国基準でデータを公開している企業の場合、XBRLファイルには非連結分のデータのみで連結分のデータは含まれていない。
おそらく、xbrlそのものを解析したほうが、処理は単純化できると思うが、xbrlに比べhtmlの方がVolumeが小さいことから、ネットワークアクセスなども考えるとhtmを扱ったほうが処理時間は短縮できるように思う。
このことから、邪道かも知れないがhtmlファイルを解読し、財務が見え~る用データを生成することにした。

なお、EDINET・TDnetともに、2014年4月以降とそれ以前では開示データの形式が大幅に変わっていることから、2014年4月1日以降に開示されたデータのみを処理対象にした。

スポンサーリンク
Rectangle大広告
Rectangle大広告

シェアする

  • このエントリーをはてなブックマークに追加

フォローする