Gilbert's Data Lab

Data drives thinking, thinking transforms data.

投資公司投資成效檢定

這篇文章是作為前篇文章的補充,提供統計檢定結果給有興趣深入了解的人。 主要藉著單一母體比例假設檢定,逐年檢定我們關心的項目是否明顯大於或小於 50%。 會採用逐年檢定的原因, 因為每年的資料並不完全獨立, 有些公司可能持有某公司好幾年後才撐到 IPO, 如此同組 投資-被投資 公司配對樣本就會連續出現好幾年, 所以這邊試著逐年檢定觀察,也可了解比例變化的趨勢。 圓圈為樣本平均,綠色棒為 99% 信賴區間,虛線為虛無假設的目標值。

新上市櫃公司中法人董監比例是否偏高?

png

除了 2000 年以外,幾乎皆明顯高於五成。

興櫃公司中法人董監比例是否偏高?

png

每年均明顯高於五成,且樣本平均高於新上市櫃公司的法人董監比例。

新上市櫃公司中主要群體比例是否偏高?

png

2002 年以前樣本平均大多高於五成,且 1998 年時明顯高於五成。 而 2003 年以後樣本平均逐年下降, 十二年的資料裡有六年明顯低於五成。 IPO 成功公司中的主要群體比例正逐年下降。

興櫃公司中主要群體比例是否偏高?

png

2008 年以前主要群體比例並不明顯低於五成, 但 2011 年以後明顯低於五成, 表示近年來主要群體在興櫃市場的投資意願不足。

有法人代表的新上市櫃公司中主要群體比例

png

2002 年以前主要群體比例明顯較高, 但 2003 年以後並無顯著差異。

有法人代表的興櫃公司中主要群體比例

png

2009 年以前八年的資料中,有五年明顯高於五成。 2010 年以後變得較不顯著,但 2014 年明顯低於五成。

對資料有以上初步了解後, 接下來我們試著應用以上結論至 IPO 預測模型試試。

應用於 IPO 模型結果

本節試著把前述結論,結合部份社會網路分析常用的中間度指標,至羅吉斯迴歸模型 (Logistic Regression Model)。 根據參數估計結果觀察結論是否一致。

解釋變數列示如下:

  1. regok: 財報表現是否符合上櫃標準
  2. maxgrp: 是否屬於主要群體
  3. degree: 連接數
  4. closeness: 標準化後 closeness centrality 取倒數,因為各年度網路大小不完全相同,故以標準化後數值處理。因取倒數故,數值越高者代表其重要性越高。
  5. betweeness: 標準化後 betweenness centrality。

假設各年的資料之間彼此獨立, 則參數估計結果如下:

Feature coef std err z P> | z |
Intercept -2.1524 0.184 -11.712 0.000
regok 1.7325 0.178 9.745 0.000
maxgrp -0.4713 0.283 -1.666 0.096
degree -0.1725 0.041 -4.212 0.000
closeness 10.5927 4.535 2.336 0.019
betweeness 36.7377 46.502 0.790 0.430

number of observations: 2149

\(R^2\): 0.0704

從以上參數估計結果可知:

  1. 財報表現因子如預期般表現顯著。
  2. 主要群體因子影響並不太顯著,而且還可能有負影響。
  3. 連接數因子表現顯著,但連接數越多,成功 IPO 機會越低。
  4. closeness 因子表現顯著,而且重要性越高則 IPO 機會越高。

用白話的方式簡述以上參數估計結果就是:

  1. 財報表現一定要合格
  2. 主要團體不會比較好
  3. 關係不一定要多
  4. 接近團體核心比較重要

雖然得到了以上結果, 但該模型應用在實際的 IPO 預測仍有一段距離。 因為該模型的 \(R^2\) 值為 0.0704, 不高的解釋程度告訴我們除了以上變數之外, 應該還有其他重要因子待我們去挖掘出來, 這點還有待後續努力。

Comments