วิธีการทำความสะอาดราคาข้อมูลสำหรับ Backtesting ข้อมูลสำหรับการทำความสะอาด backtesting ไม่ใช่เรื่องง่าย แต่จำเป็นมากที่จะได้รับผลที่มีความหมาย ราคาที่ผิดพลาดสามารถปรับแยกลาดข้อมูลราคาและเข้าใจผิด backtester เลินเล่อในความคิดพวกเขาพบจอกศักดิ์สิทธิ์เมื่อกลยุทธ์ที่เกิดขึ้นเพียงเพื่อจับด้านที่ดีของช่องว่างที่ไม่ดี นี่คือขั้นตอนในการกลั่นกรองจากข้อมูลที่สกปรกและผลิตชุดข้อมูลที่สะอาด 1. เลือกอย่างน้อย 3 ผู้สมัครผู้ขายข้อมูล 2. รูปแบบข้อมูลสำหรับการเปรียบเทียบ 3. เขียนโปรแกรมที่จะทำการเปรียบเทียบสมาร์ทและเรียกใช้ในชุดข้อมูลผู้สมัคร 3 4. วิเคราะห์ผิดพลาดเปรียบเทียบเพื่อดูว่าชุดที่เป็นข้อผิดพลาด ถ้า 2 จาก 3 ชุดเห็นด้วยครับถือว่าค่าที่ถูกต้องและขอบเขตที่ไม่ถูกต้อง 5. ส่งความคิดเห็นไปยังผู้ขายข้อมูลเพื่อให้พวกเขาสามารถแก้ไขข้อผิดพลาด 6. เลือกชุดของข้อมูลราคาที่ทางประวัติศาสตร์ที่จะใช้สำหรับ backtesting และล็อคมันลงไปป้องกันการเปลี่ยนแปลงในช่วง backtesting 7. ฟีดข้อมูลราคาทองที่จะเครื่องยนต์ backtesting กระบวนการนี้ผมใช้เวลาหลายสัปดาห์ของการทำงาน แต่ก็คุ้มค่าที่จะได้รับผลลัพธ์ที่ถูกต้อง เอาใจใส่จุดเล็ก ๆ ของการไปทำงานของ backtesting ถ้าข้อมูลพื้นฐานคือพรุนมีข้อผิดพลาด อ่านในรายละเอียดถ้าคุณจะพยายามที่นี้ด้วยตัวเองหรือของคุณถ้าคุณเพียงต้องการที่จะเห็นสิ่งที่เตรียมการไปสู่การ backtesting ร้ายแรง เมื่อการซื้อขายที่อยู่อาศัยและบุคคลที่กำลังมองหาที่ชาร์ตที่ง่ายพอที่จะมองเห็นข้อมูลที่สกปรก ช่องว่างขนาดใหญ่บนกราฟราคาจะสะดุดตาและคุณสามารถตรวจสอบข่าวในแผนภูมิที่ผ่านมา เห็นได้ชัดว่าบางช่องว่างราคาที่เป็นจริง แต่ไม่กี่ข้อผิดพลาด - มักจะแยกหรือการจ่ายเงินปันผลพิเศษที่ไม่ต้องปรับ มนุษย์การแจ้งเตือนและผู้ป่วยสามารถเรียงลำดับออกกรณี ด้วย backtesting คอมพิวเตอร์ครอบคลุมกว่าทศวรรษที่ผ่านมาข้อมูลที่สกปรกเป็นที่แพร่หลายมากขึ้นยากที่จะตรวจสอบและยากที่จะแก้ไข ขั้นตอนที่ 1: เลือกผู้ขายข้อมูลผู้สมัคร ข้อมูลที่มาพร้อมกับเครื่องมือ backtesting เป็นตัวเลือกแรกของธรรมชาติและใช่มันจะต้องทำความสะอาด! ฉันมีการเข้าถึงและ TradeStation Worden Telechart (บล็อกอาคา Backscanner, StockFinder) Thats สองชุดของข้อมูล แต่ฉันต้องการเป็นแหล่งที่เป็นอิสระดังนั้นผมจึงได้ศึกษาข้อมูลราคาประวัติศาสตร์ห่วงโซ่อาหาร เพื่อสรุปข้อมูลทั้งหมดมาจากการแลกเปลี่ยนและ บริษัท ข้อมูลเก็บข้อมูลตามการรายงานของการแลกเปลี่ยน บันทึกข้อมูลจะมีบริการสำหรับการขาย (ตามข้อตกลงกับการแลกเปลี่ยน) CSI ข้อมูลที่ประทับใจผมเพราะพวกเขาจัดหาข้อมูลสำหรับเว็บไซต์ขนาดใหญ่เช่น Yahoo, MSN, Google และผมเชื่อว่าคนนับล้านของตากับข้อมูลที่จะช่วยให้รากออกข้อผิดพลาด นอกจากนี้ CSI ข้อมูลที่นำเสนอข้อมูลเพิกถอนซึ่งจะช่วยให้มุมมองที่ถูกต้องมากขึ้นสำหรับ backtesting (CSI ข้อมูลได้เนื่องจากข้อมูลราคาเพิกถอนออกจากการเข้าถึงของเอกชนมากที่สุดเมื่อพวกเขาตระหนักว่าสถาบันจะจ่ายสำหรับมัน. ฉันรู้สึกโชคดีมากที่จะได้รับ 14 ปีของข้อมูลเพิกถอนสำหรับเพียงสี่ตัวเลข.) ขั้นที่ 2: การถ่ายโอนข้อมูลจากข้อมูล เพื่อให้ได้ข้อมูลราคาประวัติศาสตร์พร้อมสำหรับการเปรียบเทียบคุณจะต้องถ่ายโอนข้อมูลจากเครื่องมือซอฟต์แวร์ Telechart ทำให้มันง่ายที่สุดที่มีการส่งออกเป็นข้อความความสามารถภายใต้รายการเมนู Databank CSI ข้อมูลเป็นความยืดหยุ่นมากเกี่ยวกับการเขียนข้อมูลที่มากเกินไป TradeStation มีสถานที่สำหรับการเขียนออกมาไม่มีข้อมูล ผมต้องสร้างสคริปต์ภาษาง่ายง่ายที่เขียนปิดสูง, ต่ำ, เปิดระดับเสียงในแต่ละวันไปยังแฟ้มข้อความสำหรับแต่ละสัญลักษณ์ สัญลักษณ์เป็นชื่อของไฟล์ข้อความและไม่ได้อยู่ภายในไฟล์ ดูแลเพื่อให้ตรงกับรูปแบบในทั้งสามชุดของข้อมูล ผมเขียนเหมืองในลำดับนี้: วันที่, C, H, L, O, โวลต์มันสำคัญมากที่จะมักจะใช้ข้อมูลแยกที่ปรับ คำที่ฉลาดอื่น ๆ : ผู้จัดจำหน่ายแต่ละหน่วยใช้ที่แตกต่างกันของการวัดปริมาณที่คุณจำเป็นต้องปรับตาม ขั้นตอนที่ 3: การเขียนโปรแกรมเพื่อเปรียบเทียบข้อมูลที่ ด้วยโปรแกรมเช่น tkdiff ใช้ได้ฟรีบนเว็บที่ผมคิดว่าขั้นตอนนี้จะง่าย แต่ผมคิดผิด! ครั้งแรกของทั้งหมดที่มีเกือบ 7,500 tickers ก็จะใช้เวลาอีกนานเกินไปในการโหลดด้วยตนเองไฟล์ลงใน tkdiff ฉันต้องการที่จะทำงานโดยอัตโนมัติเปรียบเทียบ เมื่อฉันอัตโนมัติผมพบว่าแตกต่างกันเล็กน้อยของเงินหรือสองเกิดขึ้นเกือบทุกสัปดาห์ (ซึ่งสามารถเกิดขึ้นได้ตัวอย่างเช่นหากผู้ขายจะใช้เวลาปิดราคาดำเนินการที่ผ่านมาและผู้ขายอื่นใช้ช่วงกลางของการแพร่กระจายที่ผ่านมาระหว่างการเสนอราคาและขอราคาตามที่ปิด.) ฉันตัดสินใจอย่างรวดเร็วว่าฉันไม่ได้ต้องการทราบเกี่ยวกับ แตกต่างเล็ก ๆ ในข้อมูลระหว่างสามผู้ขาย ไม่ thats จะมีผลกระทบต่อผล backtesting สิ่งที่ไม่สำคัญ แต่เป็นช่องว่างขนาดใหญ่ที่ถูกตัดขึ้นเป็นครั้งคราว เพื่อระบุผู้ที่ผมเขียนโปรแกรมต่างเลือน มันเปรียบเทียบข้อมูลจากสองผู้ขายและธงผิดพลาดเปรียบเทียบการเรียงลำดับเป็นข้อผิดพลาดที่สำคัญ (ค่าที่มีมากขึ้นกว่า $ 0.04 ปิด) ข้อผิดพลาดเล็กน้อย (น้อยกว่า $ 0.04) และไม่มีข้อผิดพลาด ฉันวิ่งต่างเลือนครั้งที่สอง: ครั้งหนึ่งเมื่อเทียบ CSI และ TradeStation และอีกครั้งเมื่อเทียบ CSI และ Worden ชุดข้อมูล ขั้นตอนที่ 4: วิเคราะห์ผิดพลาดเปรียบเทียบ ขั้นตอนก่อนหน้าผลรายการของจุดข้อมูลราคาที่ไม่ได้เปรียบเทียบระหว่างผู้ขาย ฉันพยายามวิจัยแต่ละข้อผิดพลาดที่สำคัญที่กำลังมองหาที่สองชาร์ตราคาและการค้นคว้าข่าวในสัญลักษณ์รอบเวลาของข้อผิดพลาด ในกรณีส่วนใหญ่มันเป็นที่ชัดเจนซึ่งเป็นข้อมูลที่ผิดพลาดที่กำหนด ขั้นตอนที่ 5: ข้อเสนอแนะไปยังผู้ขายข้อมูล ฉันตัดสินใจที่จะเป็นพลเมืองที่ดีที่สุดและรายงานข้อผิดพลาดของข้อมูลที่ฉันได้พบ CSI ข้อมูลมีข้อผิดพลาดน้อยที่สุดทันทีตอบสนองต่อข้อเสนอแนะของฉันและโดยทั่วไปการปกป้องความถูกต้องของข้อมูลของพวกเขา TradeStation มีพนักงานที่ทุ่มเทที่มีการยืนยันอย่างรวดเร็วและแก้ไขข้อผิดพลาดทั้งหมดที่ฉันรายงาน Worden มีข้อผิดพลาดมากที่สุดและไม่ได้ตอบสนองในทุกเมื่อผมชี้ให้พวกเขาออก จำเป็นต้องพูดผมมากระวังของการใช้ข้อมูล Worden ในขณะนี้ ขั้นตอนที่ 6: เลือกข้อมูลราคาประวัติศาสตร์สุดท้าย ในท้ายที่สุดผมมากับรายการสุดท้ายของ tickers หุ้น tickers มีไม่กี่ที่จ้องมองผิดพลาดเปรียบเทียบและไม่มีการกระทำผิดชัดเจนดังนั้นฉันลบออกจากรายการของฉัน ฉันกำหนดชุดทำความสะอาดของข้อมูล CSI (บวกยกเลิกการตรวจสอบข้อมูลการเพิกถอน) เป็นข้อมูลทางประวัติศาสตร์ของฉันราคาทองชุด ฉันเก็บที่ล็อคลงในไดเรกทอรีที่แยกต่างหากเพื่อหลีกเลี่ยงการเปลี่ยนแปลงโดยไม่ได้ตั้งใจ (. ผู้ขายที่ปรับปรุงข้อมูลอย่างน้อยทุกวันและอาจจะแก้ไขข้อผิดพลาดแม้การแก้ไขเป็นครั้งเดียวที่ไม่พอใจเริ่มต้น backtesting - แต่ละกลยุทธ์ความต้องการที่จะดำเนินการเกี่ยวกับว่าข้อมูลเดียวกันเพื่อให้เปรียบเทียบระหว่างกลยุทธ์.) ขั้นตอนที่ 7: ฟีดข้อมูลราคาทองที่จะเครื่องยนต์ backtesting TradeStation เครื่องยนต์ backtesting ของฉันเลือกทำงานกับข้อมูลของตัวเองไปโดยปริยาย เมื่อต้องการใช้ชุดข้อมูลภายนอกคุณจะต้องมีการใช้สัญลักษณ์ค้นหาแบบย้อน & gt; แท็บ 3 พรรคเพื่อชี้ไปยังข้อมูลและยังตั้งไฟล์และแอตทริบิวต์ข้อมูลพารามิเตอร์เพื่อที่จะบอก TradeStation วิธีการอ่านมัน ดูไฟล์ความช่วยเหลือ TradeStation ภายใต้ข้อมูลบุคคลที่ 3 สำหรับคำแนะนำที่สมบูรณ์ กระบวนการนี้ลำบากช่วยให้คุณได้ถูกต้องผลที่มีคุณภาพสูงจาก backtesting 2 การตอบสนองต่อวิธีการทำความสะอาดราคาข้อมูลสำหรับ Backtesting แพท ธ อร์น | 4/02/10 ฉันเป็นโปรแกรมเมอร์ใหม่เพื่อ Forex และสนใจมากที่สุดในการประเมินของคุณ MACD เป็นตัวบ่งชี้ที่ฉันได้อ่านมากเกี่ยวกับตัวบ่งชี้ในเว็บนี้ ฉันได้พบถ้าผมรวม MACD กับ Stochastic อย่างรวดเร็วเป็นที่น่าอัศจรรย์ผลของฉันเพื่อให้ห่างไกลยังคงวิเคราะห์ havent กัดกระสุนยัง ฉันกำลังจะเริ่มต้นนี้จันทร์ที่ผ่านมา ข้อมูล backtesting ของคุณติ๊กที่เกิดขึ้นจริงหรือราคาในเวลาที่มันเกิดขึ้นเมื่อเทียบกับที่เปิดปิดสูงและต่ำต่อกรอบเวลาหรือไม่ จากวัดฉันได้อ่านฉันเชื่อว่ามี เป็นโปรแกรมเมอร์ที่รู้เล็กน้อยเกี่ยวกับการทำเหมืองข้อมูลที่ฉันสามารถชื่นชมปริมาณของเวลาและความพยายามที่คุณได้ใช้ ผมขอแสดงความยินดีความดื้อรั้นของคุณ หาก Startegy ของฉันที่อธิบายข้างต้นทำงานผมมีคุณจะขอขอบคุณสำหรับการที่ backtester | 4/02/10 ขอบคุณสำหรับความคิดเห็นของคุณมีน้ำใจ ฉันหวังว่าคุณจะดีกับการค้าของคุณกลยุทธ์สิ่งที่คุณเลือก ข้อมูล backtesting ของฉันคือปลายทุกวันเพียงแค่เปิดสูง, ต่ำ, ปิด ส่วนใหญ่ backtests ฉันกำลังเข้าสู่ตลาดในวันที่เปิดยกเว้นการสูญเสียหยุดดังนั้นมันจึงเป็นที่ยอมรับหยาบ Ive ได้ข้อมูลเพิ่มเติมเกี่ยวกับ MACD (ตามที่ใช้กับหุ้น) truthaboutmacd ที่ยังไม่ได้นำมาใช้เพื่อ MACD Forex ดีใจที่ได้ยินคุณกำลัง backtesting และประเมินสถานการณ์อย่างละเอียดก่อนที่เสี่ยงเงินสด
