この記事では株式 価格予想モデルについて解説します。
株式価格予想モデルの紹介・概要説明
今回紹介する価格予想モデルはこちら。
提示されたGitHubリポジトリのREADMEファイルについて、**「要約」「翻訳」「補足説明」**の3つのパートに分けて解説します。
1. 要約
このプロジェクトは、AI(BERTモデル)を使って、企業の決算説明資料(MD&A)から「自己奉仕バイアス」を測定するためのツール(データセットと学習済みモデル)です。
目的:
経営陣が「良い結果は自分たちの手柄(内的要因)、悪い結果は市場環境のせい(外的要因)」と説明する傾向(=自己奉仕バイアス)を、文章から自動で定量的に分析することです。
何ができるか:
- 決算資料の文章を入力すると、AIが「原因」と「結果」にあたる部分を自動で抽出します。
- 抽出した「原因」が経営努力によるものか(内的)、環境要因か(外的)を分類します。
- これにより、アナリストが手作業で行っていた定性的な分析を、大規模かつ客観的に行うことが可能になります。
信頼性:
モデルの性能は再現率(Recall)で86%以上と高く、大規模な分析にも耐えうる十分な信頼性があると主張されています。
2. 翻訳
以下に、READMEの各セクションの日本語訳を示します。
SAB_measure
財務テキストにおける原因エンティティの注釈付けと抽出
📘 概要 (Overview)
このプロジェクトは、Chen (2025)による論文「テキストマイニングを用いた自己奉仕的帰属バイアスの測定」に基づいています。
私たちは、財務報告書の「経営者による財政状態及び経営成績の検討と分析(MD&A)」セクションにおける原因エンティティ(因果関係を表す要素)を捉えた、専門家によるきめ細かな注釈付きデータセットを提供します。注釈はChen (2025)で提案された定義に従っています。
- Internal Cause (IC): 経営陣のコントロール下にある要因(内部要因)
- External Cause (EC): 環境や市場の要因(外部要因)
- Positive Result (PR): 好ましい結果(ポジティブな結果)
- Negative Result (NR): 好ましくない結果(ネガティブな結果)
私たちは、Chen (2025)で特定された最も性能の良いBERTモデルをファインチューニング(追加学習)しています。
🏷️ ラベリング手法 (Labeling Method)
私たちは、原因エンティティの範囲と種類の両方を特定するために、BIOシーケンスラベリング形式を採用しています。
- B- (Begin): エンティティの開始位置を示す
- I- (Inside): 同じエンティティの継続部分を示す
- O: いかなるエンティティにも属さないトークン(単語)を示す
ラベル付けされたデータの例は、完全なドキュメントの図1に示されています。
📊 モデルの性能 (Model Performance)
モデルの学習は以下で行われました。
- 訓練サンプル: 600件
- 検証サンプル: 200件
- テストサンプル: 200件
私たちの主要な評価指標は**再現率(recall)**です。これは、BERTが人間の専門家よりも細かい範囲を分類する傾向があり、形容詞、副詞、動詞を省略することがあるためです。例えば、専門家による [10, 30] という注釈が、モデルによって [10, 13] と [15, 30] に分割されることがあります。
- 私たちのモデルは再現率 > 86%を達成しました
- 20回の繰り返し実験において、再現率は85%から90%の間で安定していました
- これらの結果は、大規模な分析に十分な信頼性があることを示しています
図2に学習結果の詳細を示します。
⚙️ ファインチューニングのパラメータ (Fine-tuning Parameters)
モデルの学習にはHuggingFace Transformersを使用しています。
from transformers import AdamW, get_linear_schedule_with_warmup
learning_rate = 2e-5 # 学習率
num_epochs = 4 # エポック数
batch_size = 16 # バッチサイズ(小さいGPUでは8)
optimizer = AdamW(model.parameters(), lr=learning_rate, eps=1e-8)
total_steps = len(dataloaders_dict["train"]) * num_epochs
scheduler = get_linear_schedule_with_warmup(
optimizer,
num_warmup_steps=int(0.1 * total_steps),
num_training_steps=total_steps
)
また、以下の処理も適用しています。
- 勾配クリッピング: clip_grad_norm_ を最大ノルム=1.0で適用
- 自動的なGPU検出
- 訓練/検証データの分割処理
🧪 使い方 (Usage)
MD&Aテキストサンプルを入力するための標準化されたフォーマットを提供しています。ユーザーが図3に示すのと同じ構造でデータを提供すれば、モデルは図4に示すような出力を返します。
出力には以下が含まれます。
- 全てのエンティティに対する予測ラベル
- 各エンティティの4つの原因タイプへの分類
この構造は、簡単な検証と後続の分析をサポートするように設計されています。
3. 補足説明
このプロジェクトをより深く理解するためのキーワードと、その重要性について解説します。
- 自己奉仕バイアス (Self-serving Attribution Bias) とは?
心理学の用語で、**「成功は自分(内的要因)のおかげ、失敗は環境(外的要因)のせい」**と考える人間の認知的な偏りを指します。
企業経営においては、経営陣が業績を説明する際にこのバイアスが強く現れることがあります。例えば、「新製品がヒットして増益になりました(成功→内的要因)」と言う一方で、「景気後退のせいで減益になりました(失敗→外的要因)」と説明するようなケースです。このバイアスの強さを測ることで、経営陣の姿勢や透明性を評価する一つの指標になります。 - MD&A (Management Discussion & Analysis) とは?
有価証券報告書などの決算資料に含まれる項目の一つで、日本語では「経営者による財政状態及び経営成績の検討と分析」と呼ばれます。ここでは、計算書類の数字だけでは分からない経営成績の要因や今後の見通しについて、経営陣が自らの言葉で説明します。定性的な情報が豊富なため、AIによるテキスト分析の格好のターゲットとなります。 - BERT とは?
Googleが開発した非常に高性能な自然言語処理モデルです。文章の文脈を深く理解する能力に長けており、「この単語が文章全体の中でどういう意味を持つか」を正確に捉えることができます。単純なキーワード検索ではなく、文章の意味を理解した上で「原因」や「結果」を抽出できるのが強みです。 - なぜ「再現率 (Recall)」が重要なのか?
このタスクでは、「AIが原因だと判断したものが、本当に原因だったか(適合率)」よりも、**「人間が原因だと判断したものを、AIがどれだけ見逃さずに拾えたか(再現率)」**が重視されます。多少範囲がズレていても、まずは「原因」と「結果」のペアを網羅的に見つけ出すことが、大規模分析の第一歩として重要だからです。86%以上という高い再現率は、このモデルが分析対象をほとんど見逃さないことを意味しており、非常に実用的です。 - このプロジェクトの意義
従来、アナリストなどが膨大な時間をかけて決算資料を読み込み、主観的に行っていた「経営者の発言のニュアンス分析」を、AIによって高速・大量・客観的に自動化できる点に大きな価値があります。投資ファンドや研究機関が、多数の企業の経営姿勢を横断的に比較分析するための強力なツールとなり得ます。これは金融分野におけるAI活用の先進的な事例と言えるでしょう。
経営者の自己奉仕バイアスはどのように株価に織り込まれるか?
モデルの元となる経営者の自己奉仕バイアスに関する論文はこちら。
提示された学術論文の要旨(Abstract)とハイライト(Highlights)について、**「要約」「翻訳」「補足説明」**の3つのパートに分けて解説します。
1. 要約(この論文が言いたいこと)
この研究は、**「日本の株式市場は、経営者の『自己奉仕バイアス』をどのように評価しているか?」**を解明したものです。
結論を一言でいうと:
市場は、経営者の自己奉仕バイアスを**「一時的なポーズ(印象操作)」と「根っからの性格(安定した特性)」**に分けて見ています。
- 一時的なポーズは見抜かれる:
業績発表のたびに発言がコロコロ変わるような「一時的な」自己奉仕バイアスは、投資家から「印象操作だ」と見抜かれており、株価の超過リターン(儲け)には繋がりません。 - 根っからの性格は評価される(ただし、見過ごされがち):
一方で、何年にもわたって一貫して「成功は自分の手柄」と言い続けるような**「持続的な」自己奉失バイアス(=安定した過信特性)を持つ経営者の企業は、市場で過小評価されており、結果的に高い超過リターンを生み出す**ことが分かりました。
論文の意義:
この発見は、市場が経営者の心理的バイアスをただ一律に評価するのではなく、その**「持続性」**に注目して、戦略的な情報開示と根深い行動特性を区別して価格に織り込んでいることを示唆しています。
2. 翻訳
以下に、論文のハイライトと要旨の日本語訳を示します。
ハイライト (Highlights)
- 自己奉仕バイアス(SAB)を分解し、安定した行動特性と戦略的な情報開示行動の両方を特定する。
- 持続的なSABは、既知の価格決定要因を考慮しても、有意なプレミアム(超過リターン)を予測する。
- 一時的なSABは超過リターンを生まない。これは投資家が印象操作を認識していることを反映している。
- この結果は、市場が行動バイアスと戦略的開示を区別する能力を持っていることを強調している。
論文要旨 (Abstract)
日本の経営者の認知バイアスは株価に織り込まれているか? ポートフォリオのリターンからの証拠
要旨
米国に次ぐ世界第2位の資本市場である日本の株式市場は、柔軟なストックオプション行使メカニズムが欠けているため、経営者の過信を測る有名な指標(Malmendier & Tate, 2005)を適用して、市場が経営者の認知バイアスを価格に織り込んでいるかを研究することが困難であった。この方法論的なギャップを埋めるため、我々はChen et al. (2025)が開発した自己奉仕バイアス(SAB)指標を活用し、それを2つの要素に分解する:**固定的要因(非合理的な認知という安定した経営者の特性)と時間変動要因(合理的な情報開示戦略)**である。
我々の分析は、3年間にわたって持続的なSABの成長を示した企業が、有意な異常リターンを生み出すことを明らかにした。これは、安定した過信特性が依然として過小評価されていることを示唆している。この発見は、過信を持つCEOが市場パフォーマンスを向上させる可能性があるという米国での証拠とも一致する。
対照的に、**一時的なSAB(情報開示スタイルが劇的に変化すること)**は超過リターンを生まない。これは、投資家が印象操作によって引き起こされる戦略的な説明の調整を認識し、それを効果的に価格に織り込んでいることを示している。我々の結果は、経営者の情報開示に埋め込まれた認知バイアスが、資本市場の情報処理を通じてどのように処理され、価格決定されるかについて、より深い洞察を提供する。
3. 補足説明
この論文の面白さと重要性を理解するためのポイントを解説します。
- 研究の背景と新規性
- 従来、経営者の「過信(Overconfidence)」を測るには、ストックオプションをどれだけ長く保有しているか、といった指標が米国でよく使われていました。しかし、この方法はストックオプション制度が未発達な日本市場には適用しにくいという問題がありました。
- そこでこの研究では、前回のREADMEで解説したAIモデルを使い、決算説明資料の「言い回し(自己奉仕バイアス)」から経営者の過信度を測定するという、日本市場にも適用可能な新しいアプローチを取りました。これが大きな新規性です。
- 「持続的なSAB」がなぜリターンを生むのか?
- 論文では「安定した過信特性が過小評価されている」と説明しています。これはどういうことでしょうか。
- 一貫して自信満々な発言をする経営者は、一見すると傲慢に見えるかもしれません。しかし、その自信が**「イノベーションへの強い意欲」や「困難な状況でも事業を推進するリーダーシップ」**の表れである可能性があります。
- 市場は、短期的な発言の変化には敏感に反応しますが、こうした長期的で根深い経営者の「性格」や「資質」がもたらすプラスの効果をすぐには株価に織り込めず、見過ごしがちです。
- その結果、そうした企業の株価は本来の価値よりも安く放置され(=過小評価され)、後から業績がついてくることで、結果的に高いリターン(アルファ)を生み出す、というメカニズムが考えられます。
- 「一時的なSAB」がなぜリターンを生まないのか?
- 普段は謙虚なのに、業績が良い時だけ「我々の戦略が成功した」と声高に主張したり、悪い時に急に「市場環境が悪化したせいだ」と言い訳したりするような態度の変化は、投資家から**「見え透いたポーズ(印象操作)」**と判断されます。
- 賢い投資家たちはこのような短期的な変化を見抜き、「これは戦略的な発言だな」と割り引いて考えるため、株価にプラスの影響を与えず、超過リターンも生まれない、ということです。
- 投資への示唆
この研究は、単に企業の財務データを見るだけでなく、経営者がどのような言葉で業績を語っているか、そしてその語り口に「一貫性」があるかを分析することが、将来の株価を予測する上で重要なヒントになり得ることを示しています。AI技術の発展により、このような定性的な情報の定量分析が、今後の投資戦略においてますます重要になるでしょう。
経営者の『過剰な自信(自己奉仕バイアス)』から株価を予想するには?
モデルの価格予測方法に関する論文はこちら。
提示された学術論文の全体について、**「論文の構成と主張」「各セクションの要約」「投資戦略への応用」**の3つの視点から、分かりやすく解説します。
1. 論文の構成と主張(この論文は何をどうやって明らかにしたか)
問い
「日本の株式市場は、経営者の『過剰な自信(自己奉仕バイアス)』をどう評価し、株価に織り込んでいるのか?」
方法
- 指標の作成: AI(深層学習モデル)を使い、企業の決算説明資料(MD&A)の文章から、経営者の「自己奉仕バイアス(SAB)」の強さを数値化する。
- SAB:「成功は自分たちのおかげ(内的要因)、失敗は環境のせい(外的要因)」とする発言の割合。
- 指標の分解: SABを2種類に分解する。
- 一時的なSAB(USTMOM): 短期的なSABの変化。経営者が意図的に行う「印象操作(ポーズ)」と見なす。
- 持続的なSAB(STMOM): 3年間にわたるSABの傾向。経営者の「根っからの性格(安定した特性)」と見なす。
- ポートフォリオ分析: SABのレベルや傾向に基づき、企業をグループ分け(ポートフォリオ構築)し、その後の株価リターンを分析する。
主張(結論)
市場は経営者のSABを賢く見分けている。
- 一時的なSAB(印象操作)は見抜かれる:
急にSABが強まるなど、短期的な変化は投資家から「見え透いたポーズ」と認識され、株価に織り込まれるため、超過リターンは生まない。 - 持続的なSAB(根っからの性格)は過小評価されている:
一貫してSABが高い(自信家な)経営者の企業は、市場でその価値が正しく評価されておらず(過小評価)、結果として予測可能で有意な超過リターン(アルファ)を生み出す。特にコロナ後の不確実な環境下で、その傾向はより顕著になった。
2. 各セクションの要約
1. 序論 (Introduction)
- 問題提起: 経営者の過信は企業価値に影響するが、その価格評価に関する研究は限定的。特に日本では、米国で主流の「ストックオプション保有期間」という指標が使えない。
- 本研究のアプローチ: この問題を解決するため、AIで決算資料の文章を分析し、「自己奉仕バイアス(SAB)」を測定する新しい手法を用いる。
- 仮説: SABには「根っからの性格(認知バイアス)」と「意図的なポーズ(印象操作)」の2側面があり、市場の反応は異なるはずだ。
2. データと方法論 (Data and Methodology)
- 対象: TOPIX500構成銘柄のうち非金融447社(2018年~2023年)。
- SABスコアの算出: AIモデルでMD&Aの文章を分析し、「(内的要因→良い結果)or(外的要因→悪い結果)」というパターンの文章の割合をSABスコアとして算出。
- 3つの投資戦略:
- BASIS戦略: SABスコアの「レベル」で企業を5グループに分類。
- USTMOM戦略(不安定モメンタム): 1年間のSABスコアの「変化量」で分類。
- STMOM戦略(安定モメンタム): 3年間のSABスコアの「傾向」で分類(Strong Up/Weak Up/Strong Down/Weak Down)。
3. 実証結果 (Empirical Results)
- Table 2 (BASIS戦略):
- SABが「極端に高い(Q5)」企業はリターンが低い。市場が「やりすぎ」と判断し、警戒しているため。
- SABが「適度に高い(Q4)」企業のリターンが最も高い。市場がまだ完全に織り込んでいない「適度な自信」が評価されている。
- Table 3 (USTMOM戦略):
- SABが「急上昇」した企業(Q4, Q5)の超過リターンは有意ではない。投資家が「印象操作だ」と見抜いているため。
- Table 4 (STMOM戦略):
- 最重要の発見。 3年連続でSABが上昇した**「Strong Up」**グループが、**月次5.36%という極めて高い超過リターン(アルファ)**を叩き出した(特にコロナ後)。
- これは、市場が「持続的な自信」という経営者のポジティブな特性を過小評価している強力な証拠。
- このリターンは保有期間が長くなる(6ヶ月)と薄れるため、比較的新しい情報に基づいたアノマリー(市場の歪み)であることが示唆される。
- Table 5 (ダブルソート分析):
- 企業の収益性(ROA)でグループ分けしてからSABの傾向で分析しても、「Strong Up」のリターンが高いという結果は変わらなかった。
- つまり、SABが生み出すリターンは、単に業績が良いからという理由では説明できない、独立した要因である。
4. 結論 (Conclusions)
- 本研究は、AIによるテキスト分析を用いて、市場が経営者の「印象操作」と「根深い認知バイアス」を区別して価格付けしていることを実証した。
- 特に「持続的な自信」というポジティブな特性は市場に見過ごされがちで、そこに投資機会が存在することを示した。これは市場の非効率性を示す貴重な証拠である。
3. 投資戦略への応用(この研究から学べること)
この論文の結果は、個人投資家や機関投資家が新しい投資戦略を構築する上で非常に示唆に富んでいます。
- 「経営者の言葉」に注目する
- 財務諸表の数字だけでなく、経営者がどのような言葉で自社の状況を語っているか(定性情報)が、将来のリターンを予測する上で重要。
- 特に**「成功の要因を常に自社の強み(技術力、営業努力など)に結びつけ、失敗の要因を外部環境のせいにする」**という一貫した傾向があるかどうかに注目する。
- 「一貫性」と「持続性」を重視する
- 一度や二度の強気な発言ではなく、何年にもわたってブレずに自信を示し続けている経営者を探す。
- このような経営者は、単なる自信家ではなく、イノベーションを推進したり、逆境でもチームを率いる強いリーダーシップを持っている可能性が高い。市場はまだその価値に気づいていないかもしれない。
- 短期的な「ポーズ」に惑わされない
- 決算発表のたびに発言がコロコロ変わる経営者の企業は避けるべきかもしれない。
- 特に、業績が良い時だけ急に強気になるような企業は、投資家から「印象操作」と見抜かれており、長期的なリターンは期待しにくい。
- 具体的な投資アイデア
- スクリーニング: 過去3年分の決算説明会資料や有価証券報告書のMD&Aを読み、「成功=内的要因」「失敗=外的要因」という発言が一貫して多い企業をリストアップする。
- ポートフォリオ構築: 上記でリストアップした「Strong Up」候補の企業群に投資するポートフォリオを組む。この論文によれば、この戦略は市場平均を大きく上回るリターンが期待できる。
- リバランス: この効果は比較的短期(論文では1ヶ月後が最大)であるため、年に1回など定期的にポートフォリオを見直す(リバランスする)必要がある。
この研究は、AIが金融市場分析にもたらす新しい可能性を示した、非常に興味深い一例と言えるでしょう。