บทความ

NMRQL Research

รูปภาพ
จากบทสนทนากับคุณ andy โปรแกรมเมอร์ที่รู้จักกันทางกลุ่มทาง Linked เขาแนะนำโปรเจคของ NMRQL Research ที่ใช้เทคนิคการลงทุนด้วย Machine learning ทำให้มีโอกาสได้เข้าไปดูตัวอย่างของ Collective intelligence framework
แนวคิดหลักที่เปิดเผยคือ เขาพัฒนา machine learning algorithms กับข้อมูล time series ของ asset ต่างๆจำนวนหลายร้อยโมเดล (เคลมตัวเลข 960 โมเดล)จากนั้นเก็บข้อมูลผลการทำงานของแต่ละโมเดล แล้วใช้ Ensemble Methods ประเภท Voting algorithm เพื่อคัดตัว learning algorithm ที่ดีที่สุดออกมา สำหรับทำ Portfolio construction เพื่อใส่เงินลงทุนของฟันด์ Investment strategies 100% ทำงานบน AI ทั้งหมด เพื่อให้ได้ Return และคุม Risk ตามเป้าหมาย 

Concept และ Framework อาจจะดูไม่ซับซ้อนแต่ความน่าสนใจคือเรื่องของหลังบ้าน พวก infrastructure , Big Data + Alternative Data และระบบคอมพิวเตอร์ในการคำนวณและ training model ตรงนี้เรียกว่างานช้างไม่ง่ายในการทำตามเท่าไหร่

nmrql.com/research/machine-learning/

Machine Learning for Predicting The Unknown

รูปภาพ
บางทีก็อดประหลาดใจไม่ได้เวลาเห็นการนำเอา Machine Learning มาใช้ในการเทรด หรือการลงทุน ในลักษณะการโฆษณา เกินจริง ราวกับเป็นเครื่องมือศักดิ์สิทธิ์ ใช้เดาอนาคตทำ prediction ราคาได้ แม่นยำ 100% Machine Learning เป็นเทคนิคหรือวิธีการวิเคราะห์ข้อมูลที่มีศักยภาพ โดยเฉพาะการใช้การวิเคราะห์ข้อมูล(Data)จำนวนมากเพื่อสร้าง model แทนการกำหนด algorithm คงที่ด้วยมนุษย์ แต่มันก็มีข้อจำกัดเช่นเดียวกับ math model หรือ statistic model ในเรื่องการ prediction บนโจทย์ที่ผลลัพธ์มันไม่เคลียร์ หรือเป็นค่าคงที่ค่าเดิม 100% โดยเฉพาะในราคาหุ้น ราคาสินค้า ที่แปรผันตามช่วงเวลา(แม้จะมีบางส่วนที่ซ้ำกับข้อมูลอดีต) + ความไม่คงตัวจากปัจจัยต่างๆที่ทำให้เกิดข้อมูลราคาลักษณะ Random walk (random process) ดังนั้นการไปโฆษณาว่าจะทำการ predict ราคาได้ 100% ด้วยการเทรนโมเดลจากข้อมูลอดีต มันจึงเป็นเรื่องทีดูจะเป็นจริงได้ยาก แม้จะปรับ optimize โมเดลให้ผลการทดสอบออกมาดี ค่าสถิติสวยหรูเพียงใด การนำไปใช้งานจริงในตลาด แบบ real time ผลลัพธ์ที่ได้ มันก็ออกมาด้อย หรือแย่กว่า ที่ทดสอบหรือปรับแต่จนเกิด over fitting กับข้อมูลอดีตเสมอ
เขีย…

Bootstrapping Method approach to System Evaluation

รูปภาพ
เป้าหมายของการทดสอบระบบ คือการหาค่าความเชื่อมั่นในการใช้งานระบบเทรด แต่การทดสอบระบบเทรดแบบ Back testing ซึ่งมีข้อจำกัดและ Bias อื่นๆที่เกิด ทำให้จำเป็นต้องใช้การทดสอบระบบแบบ Forward testing ร่วมด้วยเพื่อนำค่าผลการเทรดมาประเมินระบบ




การทดสอบระบบแบบ Forward testing เป็นการทดสอบระบบ บนตลาดจริง สภาวะการเทรดจริงแต่ก็มีข้อจำกัดเรื่องเวลาและจำนวนข้อมูลที่เทรด โดยเฉพาะเป็นการทดสอบแบบ  single sample ที่อาจจะทำให้ได้ค่านัยยะสำคัญทางสถิติที่ไม่ดีเพียงพอ ตรงจุดนี้เทคนิคของ bootstrapping สามารถเข้ามาช่วยในการวิเคราะห์ข้อมูลเพื่อการเทรด เพื่อให้เกิดความเชื่อมั่นที่ดียิ่งขึ้นได้




ในการทดลองนี้ เรามีระบบเทรดที่ทำงานจริงในตลาดค่าเงิน โดยใช้บัญชีขนาดเล็กเพื่อทดสอบ Forward Testing ในระยะเวลาการทดสอบ 1 ปี คิดเป็นจำนวนการเทรดราวๆ 240 ครั้ง



นำผลการเทรดที่ได้มาทำการประมวลผล และดำเนินการวิเคราะห์ค่าโดยในการทดลองนี้ทำการเลือกข้อมูลแล้วใช้ bootstrapping re-sampling method ทำการวิเคราะห์ค่าสถิติของข้อมูลผลการเทรดทั้งหมด


โดยหาค่า probability distribution ของ  log return ทีเกิดในแต่ละวันเลือกช่วง 95%confidence inte…

Halite: 2sigma Open source AI programming Project

รูปภาพ
twosigma เป็นบริษัท Quant Fund อันดับต้นของโลก เขามีวิธีการคัดเลือกนักพัฒนา โปรแกรมเมอร์เข้าร่วมทำงานในบริษัทจากการจัดพัฒนา Bot เพื่อแข่งขันในวีดีโอเกมส์ชื่อ Halite ตัวของ Halite เป็น open source artificial intelligence programming ประเภท turn-based strategy (TBS) ที่สร้างมาให้คนพัฒนา Bots มาสู้กันในเกมส์โดยบอทผู้เล่นแต่ทีมจะมียานอวกาศ 3 ลำที่ช่วงชิงยึด/ขุดพื้นที่ดวงดาวบน two-dimensional virtual board ผู้อยู่เบื้องหลังโปรเจคเกมส์นี้คือ Alfred Spector ตำแหน่งเป็น CTO ของ Two Sigma บริษัท hedgefund อายุ 15 ปีที่มี AUM ระดับ $50 billion โดยในคลิปคุณ Spector ให้สัมภาษณ์ว่าบริษัทต้องการค้นหาคนเก่งด้านการสร้าง algorithm ประเภทกลยุทธ์เข้ามาร่วมงาน ผ่านการจัดลีกการแข่งขัน Halite ปัจจุบันเป็นปีที่ 2 แล้วมีทีม 6000 ทีมจากทั่วโลกเข้าแข่งขัน และมีทั้งระดับนักเรียนมัธยมจนถึงผู้ใหญ่ เข้าร่วม


ปัจจุบัน Bots ทีมที่ทำผลงานได้ดี ใช้เทคนิคของ Machine learning ในการพัฒนา AI เพื่อหา solution ในการแข่งขันเอาชนะผู้ต่อสู้ ซึ่งบริษัทเตรียม Google credits สำหรับ GPU บน Google Cloud เอาไว้ให้ด้วยเพื่อ training …

sentiment analysis

รูปภาพ
Sentiment Analysis (SA) คือ การวิเคราะห์ข้อมูลที่บ่งชี้สภาวะทางอารมณ์ของคน ที่เกี่ยวข้องกับตลาด หรือสินค้า ปัจจุบันที่อินเตอร์มีบทความต่อการเชื่อมต่อและสื่อสารระหว่างบุคคล โดยเฉพาะการแสดงออกทางอารมณ์(ความคิด ความรู้สึก) รวมไปถึงการรับรู้ข้อมูล ข่าวสารที่รวดเร็วผ่าน social network ทำให้ sentiment data เป็นอีกข้อมูลที่สามารถนำมาใช้ในการวิเคราะห์เพื่อบ่งชี้ ภาวะของตลาดและการเปลี่ยนแปลงที่เกิดได้




การพัฒนาระบบสำหรับ sentiment analysis จากข้อมูลบนอินเตอร์อาศัยเทคนิค  Natural Language Processing (NLP) และ Machine learning เพื่อวัดภาวะทางอารมณ์ของคนในตลาด (ลักษณะ opinion mining ) , โทนความคิดเห็นของนักวิเคราะห์ กูรู รวมถึง บุคคลสำคัญที่มีอิทธิพลต่อราคาสินค้า บนสภาวะการณ์ที่เกิดในขณะเวลาต่างๆผ่านข้อความ จากสื่อออนไลน์ เช่น เว็บข่าว(news feed) , บทวิเคราะห์/ความคิดเห็น , twitter เป็นต้น เพื่อทำการจำแนกค่าคะแนนเชิง sentimental  จากนั้นทำการวิเคราะห์ความสัมพันธ์ ระหว่าง sentimental data กับข้อมูล Price , volatility และ Volume(Liquidity) ที่เกิด ณ เวลาต่างๆเพื่อใช้ในการนำไปต่อยอดพัฒนากลยุทธ์ในการเ…

Google Colaboratory

รูปภาพ
เช้านี้ได้ลอง Colaboratory ซึ่งเป็นโปรเจคเก่า แต่ Google เอามาทำใหม่เพิ่ม AI Framework เข้าไป ทำให้ Colaboratory สะดวกมากในการใช้ทำงานร่วมกัน เขียน code ร่วมกัน Google น่าจะพยายามส่งเสริมเรื่องการเรียนรู้และการวิจัยพัฒนา นำ Machine learning ไปใช้ในงานด้านต่างๆ

ตัว Colaboratory เป็น Python3 + Jupyter Notebook ที่ทำงานออนไลน์ รับบน cloud server ของ Google จากมีโอกาสทดลองรัน CNN และ LTSM กับ ข้อมูล MINST และ Time series ข้อมูลราคาหุ้นสหรัฐ ผลการทำงาน ถือว่าดีทีเดียว ใช้เวลารันไม่นานมาก ที่สำคัญตัวนี้ ฟรี ไม่มีค่าบริการ

นอกจากนี้ Colaboratory มาพร้อมกับ AI Framework ที่ค่อนข้างครบเลย โดยเฉพาะ Tensor flow ของค่าย Google และมี lib พื้นฐานงานด้าน Machine learning และ Data Science ของ Python ครบถ้วน นอกจากนั้น user ยังสามารถติดตั้ง package เพิ่มได้อีกด้วย
Google เสริมเรื่อง Google APIsเข้าไปอีก นั้นคือเราสามารถเขียน code python เข้าถึงไฟล์บน Google Drive เพื่อนำมาใช้ประมวลผลหรือเก็บข้อมูลผลลัพธ์ได้อีกด้วย รวมถึงการใช้ Big Query API ด้วย

อันนี้แนะนำเลยครับ สำหรับคนอยากเรียนรู้ด้านนี้ สะดวกมาก…

Alternative Data

รูปภาพ
StockTwits จัดงาน Stocktoberfest 2017 ที่ San Diego มีหลายคลิปสัมนาที่น่าสนใจปล่อยออกมา ผมกำลังนั่งตามเก็บอยู่ หนึ่งในนั้นที่วันนี้มีโอกาสได้ฟังจบ คือหัวข้อ alternative data เขานำผู้เชื่ยวชาญด้าน Quant ใน wall street ได้แก่ Tim Harrington จาก Battlefin, Erik Haines จาก Guidepoint, Morgan Slade จาก CloudQuant, และ Chris Petrescu จาก WorldQuant มาแลกเปลี่ยนและให้ความรู้ ประเด็น The rise of quants and alternative data

Alternative data ตอนนี้กำลังเป็น hot topic เติบโตและเป็นที่ต้องการมาก คุณ Petrescu พูดถึงคำว่า quantamental แนวทางของ Quant ผสมผสานกับ Fundamental เดิม กล่าวโดยสรุปคือ alpha model ในการลงทุน จากการใช้ทั้งข้อมูล fundamental เดิม(งบการเงิน) รวมกับข้อมูล alternative data เพื่อสร้างโมเดลประเมินกิจการ ทำนายผลประกอบการ ตัวเลขรายได้ของบริษัท





Alternative data ที่พูดถึงมีตั้งแต่ข้อมูลเชิงตำแหน่ง เช่น geolocation จาก mobile ,ภาพถ่ายดาวเทียม(ตัวอย่างเช่นติดตามจำนวนรถในลานจอดรถของห้าง) , ข้อมูลการใช้บัตรเครดิต ยอดบัตรเครดิตในร้านค้า หรือสถานที่ต่างๆ ,ข้อมูลตำแหน่งและการเคลื่อนที่ของคนจา…