AI或理財機器人以行銷為多 - 期貨

Andrew avatar
By Andrew
at 2019-11-29T00:48

Table of Contents

個人十幾年前還在上班累積操作資金的時候, 有過台股市值最大公司的類data scientist
經歷, 也是Oracle ERP的data architect, 並受過SAP Data Warehousing 模組的訓練,
也就是之前上班十幾年的工作都是靠data吃飯(全職操作後更是努力地玩data, 近幾年趕
流行也嘗試過AI). 對於不懂大數據或區塊鏈的, 改天也附上我曾寫過的掃盲文

近幾年理財機器人或是人工智慧(AI), 因為AlphaGo戰勝棋王的宣傳變得很夯, 不少人以
為面對類似的市場戰局(抉擇), 人工智慧必定很有發揮的空間; 現實卻殘忍地告訴您, AI
團隊努力了幾年卻宣告失敗了, 改轉進醫療相關領域, 可參考連結報導
zhuanlan.zhihu.com/p/31913355 (也有人說是假新聞)

簡化地告訴您, 人工展現智慧前, 必須有一段機器學習的過程; 而這機器學習(ML)通常可
以這樣定義:「透過從過往的資料和經驗中學習並找到其運行規則。」然而正是這 [資料
] 和[經驗] 侷限了一切!

黑天鵝的由來大家都知道吧? 話說古時候北半球的人, 一輩子根本沒機會看過南半球的天
鵝有些是黑色的, 因此他的 [資料] 和[經驗] 就侷限在天鵝只會有白色的, 所以我們拿
來訓練機器的資料也只能會有白色的(沒發生過的資料, 人類也無能更不可能預見出來),
當這種訓練下來的人工智慧機器, 後來遇到它沒見過的狀況(黑天鵝)時, 您還會認為它會
做出有智慧的反應嗎? 哪怕它學習時用的演算法是什麼manifold regularization或是
TSVM都沒三小路用

市場因為參與者眾多, 組成分子又會汰舊換新(不管是被抬出場或真正死亡), 市場老師的
行為是一直在改變的, 對人工智慧機器來說, 就是不斷地用新出的黑天鵝(它的學習資料
庫不存在這些資料), 去挑戰它好不容易用演算法搞出來的規則, 這只會讓它不斷地傻眼
而已. 圍棋變數多但仍是有限解(雖窮舉後的資料龐大), 人類可以用有限解的部分集合
(ex: 棋譜資料)去訓練電腦, 讓它能在限定時間內算出最佳可行解; 但交易市場屬於無限
解... 很難辦!

結論回到好的操作方法絕對不是單從市場實戰經驗導出來的, 也可以看做在歷史資料(實
戰經驗)中找賺錢的行為或方法, 是有問題的. 繼續重申 --- 正確的作法應是先有理論或
model, 理論的涵蓋度夠廣後(把看不見黑天鵝的機率降低), 再用歷史資料去印證理論
(model)在已發生資料中的實務可行性, 並且達到在 [不修正] 任何參數的前提下, 且在
[不同時間架構]中, 和 [不同商品] 間, 都有同樣水準以上的穿透性(以上 [三不] 最重
要)


有人提問 ---

若給AI夠多的資料,涵蓋的範圍夠廣,譬如幾十年的資料,幾百個市場,正常人類考慮不
了這麼大量的資訊,但對AI卻只是運算速度跟儲存空間的問題。就像一個累積幾百年歷史
經驗的老師父,是不是能讓AI對戰人類(壽命只有幾十年和有限的思考力)取得優勢呢?

Ans: 現階段做不到, 未來我不敢說!
如果您對AI技術有一點了解的話, 搞AI很耗各種資源的. 舉自己例子來說(用R語言寫的,
不知用Python會不會比較快, 我是覺得不會), 曾經花過30天才準備完約3000筆訓練資
料, 用等級最高的CPU i7來跑(沒有另加AGP), 跑個沒很難的演算法(SVM)讓機器去找
rules, 不誇張需要跑3天, 您都會以為機器是不是當掉了! 所以您可以看到為啥前幾年AI
流行的時候, 賣AGP可加速運算的nVidia股價大飆高. AGP能加速多少? 算很厲害讓機器三
天改跑半天就好, 您還是很可能誤認是當機的(還只有三千筆而已) 哈哈

所以太小看現階段AI所需要的資源(軟. 硬體. 各種專家. 訓練資料), 幾十年的資料? 幾
百個市場? 單一公司很難做到, 即便是google也難! 況且最大的問題在於各式訓練資料的
準備(clean, ETL, label), 這需要很專精的domain expert和data scientist, 並且要花
去最多的時間(可能要比訓練機器更久), 加上適格人才難尋啊! 如果在哪一個市場成功
了, 保證google會出來大吹大擂, 就像當初打敗棋王一樣, 沒有這種行銷, 後面的投資者
會繼續出錢? 股價怎辦? 怎麼吸引更多人才? ....???

確實跑多一點訓練資料, 有機會讓機器聰明一點, 但還是不脫主文所提過的 --- 沒發生
過的資料, 人類不知道也無能力, 更不可能預見出來, 只能繼續發生遇見黑天鵝而傻眼的
狀況

其實, 如果有真正強的domain expert和data scientist, 可以避免機器重複學類似的東
西, 資料多若沒篩過, 不會比較好, 所以上面也說 data clean更費工

p.s. AGP是GPU古時候的說法, 用A (Accelerated)比較有加速感

有人問說: 新聞中的沃牛一號是如何辦到絕對獲利的?是短期現象(AI根據短時間(3年
)的資料在短時間內沒遇到黑天鵝)還是自吹自擂的可能性比較大?

我的回答是: 請注意它的用詞是: [回測]的數據令人震驚; 我也常開發出回測令人震驚的
策略, 實際上線使用後也真的令我震驚, 賠錢到趕忙讓程式下架. 絕對獲利就只是不賠另
種說法而已, 要做到沒很難, 我每週公開的實單測試便屬於這種, 但要承受獲利低的缺
點, 大多數情況都是trade-off, 很難兩者兼得的, 如果可以, 這種大發現會得諾貝爾獎
--- Harry Markowitz的論文得獎(同時獲利最大化+風險最小化)

關於人工智慧, 您可以把機器想像成很小的小孩, 看您要怎樣教育他, 每個人教育小孩的
方法都不同. 這就是我說準備訓練資料時的domain expert最重要, 不是只有我們這種
data scientist是關鍵. 根據完全同樣一份市場的報價歷史資料, 您可以將訓練資料準備
成好幾種, 一種是讓機器去學遇到哪幾種狀況同時存在時去做交易的; 另一種是讓機器去
學後面的人心計算是怎麼運作, 然後據此再去交易的, 而其他種則看domain expert的創
意. 像小孩學課程一樣, 教材不同, 學出來的孩子技能也都不同. 當然教材笨笨的, 學出
來的小孩也是笨笨的, 教材裡面沒涵蓋的(ex: 黑天鵝), 被教育出來的小孩要知道也難.
所以才強調AI的重點不在後面的技術, 反在於訓練資料的準備

--
Tags: 期貨

All Comments

Carol avatar
By Carol
at 2019-12-01T03:45
好吧 最後真的說到重點 終於知道為什麼中國文化都那麼
Poppy avatar
By Poppy
at 2019-12-05T11:12
Eartha avatar
By Eartha
at 2019-12-09T12:59
trade-off真的是關鍵 挑行情讓相對應的策略去跑 才長久
Steve avatar
By Steve
at 2019-12-13T05:52
回測超乎績效 可能代表當時都順勢 結果上線就遇盤整掛點
Elvira avatar
By Elvira
at 2019-12-16T16:43
最佳化到機制上限就掛了啦。越簡單越好
Regina avatar
By Regina
at 2019-12-21T12:36
Xaymaca 沒辦法,半百老翁手腳慢,有時還腳麻
Heather avatar
By Heather
at 2019-12-23T19:02
大部分的想法沒錯 推推 QQ
Isla avatar
By Isla
at 2019-12-26T20:07
推推
Hedda avatar
By Hedda
at 2019-12-28T23:58
Dora avatar
By Dora
at 2019-12-30T02:09
我用python,五分鐘就跑完了,除非大大是強化學習,否則
不至於跑三天
Barb Cronin avatar
By Barb Cronin
at 2019-12-31T23:26
@max780417 我上線的程式通常訴求adaptive
沒有參數 沒法窮舉參數跑最佳化
Ula avatar
By Ula
at 2020-01-04T15:28
其實 如果想達到在文中 [不修正] 任何參數的前提
Kelly avatar
By Kelly
at 2020-01-07T22:00
設法把程式寫成自適應性(adpative) 就是一種會自己因應
Margaret avatar
By Margaret
at 2020-01-09T19:11
市場行為改變而自動改變的程式 也就是不用參數的程式
Ivy avatar
By Ivy
at 2020-01-13T17:19
既然程式沒用上任何參數了 也無所謂改變參數
或對參數做最佳化了
Doris avatar
By Doris
at 2020-01-18T05:22
@kaiblack SVM + KNN 可能是硬體沒配GPU
Aaliyah avatar
By Aaliyah
at 2020-01-18T12:29
再來就是我自己程度不夠
Oliver avatar
By Oliver
at 2020-01-21T16:52
老話一句 預知未來 請研究哈里謝頓的學說

全職操作選擇權超過12年之心得

Tristan Cohan avatar
By Tristan Cohan
at 2019-11-28T21:29
A) 真正把交易當成一份全職工作後, 它會和您之前的工作一樣, 不全然都那麼美妙 B) 這份工作的風險控制在自己手上, 意志力和執行力很重要 C) 但這份工作的成本很高, 如果您把辭掉的正職所能獲得的收入算進去的話 D) 期商的成本一直在變化, 您如果不去主動和營業員協商, 不要奢想手續費會自動降低 E) 不 ...

改進賣方報酬該努力的方向

Genevieve avatar
By Genevieve
at 2019-11-28T21:23
商品選擇: (不專於options) 非線性產品中加入線性產品 =andgt; 雜揉共存 操作方法: (不限於價外買賣, 價內買或價內賣也不用排斥) 賣方為主, 買方為輔 =andgt; 買賣兼修 契約挑揀: (不囿於大點數或小點數, 價平價內價外皆不忌) 以自己能接受之模擬調整後的損益結果, 去挑選合適 ...

108年11月28日 三大法人買賣金額統計表

Linda avatar
By Linda
at 2019-11-28T14:59
※ [本文轉錄自 Stock 看板 #1Ttt0wVF ] 作者: coconing (證 ㄓㄥˋ 券 ㄑㄩㄢˋ) 看板: Stock 標題: [其他] 108年11月28日 三大法人買賣金額統計表 時間: Thu Nov 28 14:59:03 2019 http://www.twse.com.tw/z ...

108年11月28日 期貨收盤價&結算價一覽表

Dora avatar
By Dora
at 2019-11-28T14:51
http://www.taifex.com.tw/cht/index 108年11月28日 期貨收盤價andamp;結算價一覽表 類別 收盤價 當日結算價 台指期12 11614 11613 電子期12 503.05 503.2 金融期12 ...

2019/11/28 盤後閒聊

Lydia avatar
By Lydia
at 2019-11-28T13:51
11月快結束了 感恩節放假 還會有行情嗎QQ? ----- Sent from JPTT on my Xiaomi Redmi Note 5. - ...