Gilbert's Data Lab

Data drives thinking, thinking transforms data.

Ubuntu 安裝設定

最近為了安裝 CUDA,重灌了好幾次, 這邊先紀錄一下重新安裝套件步驟。

更新套件、安裝常用套件

>> sudo apt-get update
>> sudo apt-get upgrade -y
>> sudo apt-get install tmux git openssh-server vim

NVIDIA 驅動程式

(NVIDIA 系列圖形加速卡適用)

先用指令找出顯示卡適合的驅動程式,若要使用 CUDA 就得安裝 NVIDIA 驅動程式。 CUDA 7.0 以上需要 NVIDIA 352.XX 驅動程式, 如果查詢後沒出現的話,就是顯卡不支援了。

>> ubuntu-drivers devices

假設這邊選擇 nvidia-352,

>> sudo apt-get purge xserver-xorg-video-nouveau
>> sudo apt-get ...

投資公司投資成效檢定

這篇文章是作為前篇文章的補充,提供統計檢定結果給有興趣深入了解的人。 主要藉著單一母體比例假設檢定,逐年檢定我們關心的項目是否明顯大於或小於 50%。 會採用逐年檢定的原因, 因為每年的資料並不完全獨立, 有些公司可能持有某公司好幾年後才撐到 IPO, 如此同組 投資-被投資 公司配對樣本就會連續出現好幾年, 所以這邊試著逐年檢定觀察,也可了解比例變化的趨勢。 圓圈為樣本平均,綠色棒為 99% 信賴區間,虛線為虛無假設的目標值。

新上市櫃公司中法人董監比例是否偏高?

png

除了 2000 年以外,幾乎皆明顯高於五成。

興櫃公司中法人董監比例是否偏高?

png

每年均明顯高於五成,且樣本平均高於新上市櫃公司的法人董監比例。

新上市櫃公司中主要群體比例是否偏高?

png

2002 年以前樣本平均大多高於五成,且 1998 年時明顯高於五成。 而 2003 年以後樣本平均逐年下降, 十二年的資料裡有六年明顯低於五成。 IPO 成功公司中的主要群體比例正逐年下降。

興櫃公司中主要群體比例是否偏高?

png

2008 年以前主要群體比例並不明顯低於五成, 但 2011 年以後明顯低於五成, 表示近年來主要群體在興櫃市場的投資意願不足。

有法人代表的新上市櫃公司中主要群體比例

png

2002 ...

新創企業的貴人-投資公司

本文為作者與中央研究院資訊所何建民老師、台灣大學會計系王泰昌教授合作指導研究計畫的一部分。 主要討論新上市櫃公司的法人股東角色,法人股東主要有以下幾種:

  1. 國外法人
  2. 國內上市櫃公司
  3. 國內投資/創投公司
  4. 金融業

根據前文我們了解臺灣的企業投資網絡中, 存在一個由各大財團、金融業、黨營事業等合成的主要群體。 既然在長期下持續維持此結構, 那麼有志於在臺灣上市櫃的企業應如何尋找創投資金?

好的創投資金可以有多種定義,如:

  1. 提供法律、財務、技術等協助
  2. 提供相關資源拓展公司業務
  3. 對公司營運現況提供建議
  4. 協助公司上市櫃

鑑於前三點不易觀察, 故我們試圖從第四點來討論好的創投公司。 分析資料來自於 TEJ 資料庫 1996-2014 間新上市櫃公司資訊, 根據各公司上市櫃前一年 12 月的董監名單進行統計。 從該資訊可得知各新上市櫃公司獲得哪些公司投資。

以下分析將就幾個層面依序討論新上市櫃公司的優勢:

  1. 歷年新上市櫃公司概況
  2. 法人董監事是否存在優勢?
  3. 主要群體的法人董監事是否存在優勢?
  4. 是否存在優秀的投資公司?
  5. 法人董監之間有何合作關係?

歷年新上市櫃公司概況

歷年的新上市櫃公司家數分佈如下:

png

而新上市櫃公司的產業分佈如下:

png

主要以電子相關產業為主。

新上市櫃與興櫃公司的法人董監比例是否偏高?

根據每年新上市櫃公司與興櫃公司的法人董監事資訊, 我們想了解新上市櫃公司的法人董監事比重是否明顯較高。

png

由圖中可見平均約有七成四左右的新上市櫃公司有法人董監事 ...

台灣上市櫃公司網絡變化史

本文為作者與中央研究院資訊所何建民老師、台灣大學會計系王泰昌教授合作指導研究計畫的一部分。 旨在應用臺灣上市櫃公司歷史公開資訊, 探討 1998-2014 年間上市櫃公司的企業投資網路。 資料來源以臺灣經濟新報 (TEJ) 資料庫為主, 但 公開資訊觀測站 亦可找到相關資訊。

從經濟部的營利事業登記資料可以得知, 眼下各大財團、國營企業、金融機構與黨營事業彼此交叉投資形成一個主要群體, 某種程度上可視為黨國資本主義時代下遺留的產物。 那麼這種企業間的投資網路,在過去具有什麼特徵?這些年來又產生那些變化? 乃至於我最想問的一個問題是:這種企業間的投資網絡對我們具有何種意義?

要想回答這些問題,需仰賴臺灣上市櫃公司與公開發行公司的公開資訊。 為了因應證交所的資訊要求,這些公司需定期揭露轉投資公司、對中國投資、董監事與大股東持股資訊, 而這些資訊成了我們建構不同時期企業投資網絡的最大資料來源。

在分析前先講結論:

  1. 每年上市櫃公司家數逐年遞增。
  2. 整體產業分佈以電子業為主。
  3. 主要集團間共同或交叉投資,形成大群體現象一直存在。
  4. 主要群體的公司數佔整體比重逐年上升,但密度逐年下降。

基本分析

上市櫃公司家數與產業分佈可以下圖表示:

png

那麼就投資關係而言,這些年究竟出現多少公司?

png

主要資料來源大多來自於公司財報裡的長期投資項目。

長期投資項目並不僅止於國內,也包含國外的股權投資或百分百持股子公司。 2011 年以後,因為證交所要求於合併財報中揭露集團轉投資之故, 故一般投資人更有機會了解各集團整體轉投資概況。

董監事法人代表資訊乃指各上市櫃公司董監事名單中的法人代表資訊, 這部份資訊較長期投資資訊少。

最後是轉投資中國的資訊 ...

台灣公司關係圖後續計畫

在參加資料科學愛好者年會暨第十次黑客松之後,要先寫下後續計畫提醒自己盡快完成。

寫在開頭之前,有些感想先提一下,我是資料分析的愛好者,也是 Taiwan R User Group 長期參與者。 受到 g0v 村長感召(躺在病床上還不忘寫程式真是太讚了)而決定投入開放資料的分析研究。 作這個一邊是興趣一邊當練功,雖然無償但我作得爽。 參加過資料科學愛好者年會後,我發現其實也有許多人在不同的領域作類似的傻事(笑)。 以下是 g0v 黑客松成果發表時想說但來不及說的事:

  • 開放原始碼:這個一開始就想做了,但我程式碼寫很醜,所以得先把程式碼作些整理後再放到 Github,也歡迎更多同好指教。

  • 資料庫上線:我要先研究怎麼把資料庫丟到 AWS 去,供作以後網站查詢使用。

  • 整合現有台灣公司關係圖網站:我玩過一陣子 Flask 跟 Bootstrap,但發現要把前後端所有技能點滿很難...Orz。 要請 g0v 的眾高手幫忙了。

  • 整合其他外部資料:以後陸續加上

關於集團分類的部份我自覺還可以作到更好, 所以之後還會逐漸改善模型, 以後若想到什麼有趣的議題也會在這 ...

集團間研究

「台灣究竟存在多少集團?」
這是我第一次接觸到台灣公司關係圖資料時第一個浮現的問題,所以有了這一系列文章出現。

從第一篇文章中,我們從法人投資關係中發現了一個橫跨國營事業、黨營事業與財團的超大型集團,並試圖從不同角度觀察該集團的主要成員。但即使在這一個大型集團中,仍然可以 辨識出一些主要的家族集團與少數次要的集團。那麼這些集團大致上有哪些成員?不同集團間有怎樣的合作關係?如中研院社會所李宗榮老師的研究 中,各個家族財團除了發展家族事業之外,也會與其他家族共同 合作投資新事業,擴大經營版圖。那麼是否有辦法辨識出這些策略聯盟的企業,甚至是從這些策略聯盟企業發掘不同集團間的親密程度?

首先必須要承認的是分類集團並不容易,因為有以下難題必須面對:

  1. 集團投資可分為法人投資與自然人投資兩種,其中自然人投資面臨同名同姓的問題,所以多少具有猜測成份。
  2. 某些公司董監事名單由多家公司的法人代表組成,此因其為不同集團共同成立的策略聯盟,故同時為多個集團成員。
  3. 又有某些公司,雖然董監事名單存在兩間以上公司,但其實均屬同一集團,並不保證能完全辨識出來。
  4. 某些大集團,如新光集團,其投資母公司由多家投資公司或財團法人組成。各家投資公司或有彼此交叉持股集團子公司 ...

關於台灣公司關係圖

關於本站台灣公司關係圖系列的文章,其實是因緣際會拿到 RonnyWang 抓的資料,剛好自己又對集團研究很感興趣,所以就一頭栽進去了。 對於黨營事業的研究,只是因為剛好在分析過程中,發現黨營事業的規模竟然也可與其他財團相比。 在跟中研院社會所李宗榮老師討論過後,才知道以前就有不少學者為文指出黨營事業的問題,就決定來寫篇文章作 update。 但會引起這麼多人關注,實在出乎意料之外。

不過本系列尚未結束,除了我一開始最想問的集團問題仍未有滿意的答案外,分析過程中其實還有其他有趣的故事可以寫,這些都會在後續系列文章一一補上。 也歡迎各位不吝提供指教,若對哪些內容比較感興趣也歡迎留言,我會盡量協助回答,感謝各位。

集團研究--榮化

本文將就李長榮化工的董監事社會網路結構進行探討,資料來源為 台灣公司關係圖 6 月份資料。

首先想知道有哪些公司名稱與"李長榮"有關?

idname
39054405李長榮化學工業股份有限公司
20563007李長榮實業股份有限公司
97173920李長榮科技股份有限公司

看起來我們的研究重點應該是統一編號 39054405 的「李長榮化學工業股份有限公司」,他同時也是上市櫃公司。 但我們相信這三間公司之間應該是有關係的,故我們可以試著藉由社會網絡分析來觀察。

集團成員

我們以李長榮化工為基礎,逐層分析李長榮化工的集團成員(以下簡稱榮化集團),可建構出企業網路生態圖如下:

srcdstcntseatseatratio
李長榮化學工業股份有限公司尚茂電子材料股份有限公司1218.33
李長榮化學工業股份有限公司福聚太陽能股份有限公司11436.36
李長榮化學工業股份有限公司惠利投資股份有限公司44100 ...

黨營事業知多少

黨營事業知多少?

本文將就國民黨營事業的社會網路結構進行深入探討,資料來源為 台灣公司關係圖 6 月份資料。

前篇文章提到台灣企業生態圈中的超巨大關係企業集團,其中黨營事業處於該集團核心位置,而黨營事業又主要以中央投資為核心向外延伸。關於國民黨黨產多寡,其實我們亦可從年 報得知,不一定要如此費心挖掘。但本篇研究重心在於表現黨營事業的投資分佈概況,其核心人物主要以誰為主?有哪些財團企業與黨營事業往來密切?甚至藉由比較核心人物擔任董 監事的公司,我們還可以找出不屬於中央投資的投資範圍,但仍與國民黨有密切關係的公司。這些公司可能是直屬國民黨,亦有可能是與國民黨往來較為親密的公司。藉由這層董監事 的親密關係,我們有理由相信這些公司能得到比其他公司更多的資訊交流機會,幫助這些公司進一步擴大經營優勢。

黨營事業成員

國民黨的黨營關係事業成員,以中央投資為核心,層層向外投資。 在不考慮是否有絕對控制權的情況下,可建構出企業網路生態圖如下:

另開新頁

png

在本圖中,藍色點代表具絕對控制權之企業,暗紅色點為關係企業,而紫色點為其他共同投資者。
在連結的圖中,綠色點代表具絕對控制權之企業,橙色點為關係企業,而藍色點為其他共同投資者,越粗的線代表席次比重越高。

整體而言,與中央投資有關的事業高達 119 家公司,投資標的橫跨金融、科技、建設與民生消費等行業,甚至包含了台灣證交所 ...

使用 Pelican 建立 blog

這篇要介紹如何使用 pelican 建立 blog。 Pelican 是用 python 搭建的 blog 系統,在整合 IPython notebook 這部份頗受好評。 所以也不少人用 IPython notebook 寫完報告或教學後,直接用 Pelican 建立的 blog 發表文章。

基本上雖然在第一 po 有略為提到如何建立 blog, 但事實上我還是為了一些技術問題抓掉不少頭髮。 還好問題全部都解決了,所以在這邊作個紀錄。

我使用的作業環境是 ubuntu 14.04 LTS, Python 2.7.8,參考資料來源為: