Design Deterministic Machine de Sistemas de Negociação com Strict Cross-Validation.
Um sistema de negociação de alta taxa de ganho para o SPY foi projetado usando um método determinístico e um simples preditor de preço. A validação cruzada de resultados na amostra foi realizada em amostras fora de SPY e de uma segurança anti-correlacionada. Os resultados mostram que os sistemas de negociação de alta taxa de ganho com risco apropriado: taxa de recompensa podem ser usinados e até mesmo lucrativos em um mercado correlacionado.
Definições.
O design determinista da máquina dos sistemas de negociação é um processo que produz o mesmo resultado cada vez que minima os mesmos dados com os mesmos parâmetros de projeto. Este é um processo compatível com os requisitos de testes e análises científicas. Note que a maioria dos algos de design de máquina baseados em redes neurais ou algoritmos genéticos não produzem em geral o mesmo resultado quando alimentados com os mesmos dados e os mesmos parâmetros devido à aleatoriedade nas condições iniciais.
A validação cruzada é o processo de avaliação de como os resultados do projeto da máquina executam em um conjunto de dados independente com a finalidade de proteger contra erros de Tipo III, isto é, o teste de hipóteses sugeridas pelos dados. No entanto, no caso do design da máquina, é sabido que a validação cruzada simples não é suficiente devido ao teste de hipóteses múltiplas e ao snooping de dados. Procedimentos mais avançados de validação cruzada são necessários para avaliar o significado dos sistemas de negociação desenvolvidos através do design da máquina. Neste blog, além do teste fora da amostra, outro teste rigoroso é realizado em uma segurança anti-correlata durante o mesmo período de dados não visto.
Processo de Design de Máquinas.
Configuração de dados e parâmetros de desempenho na amostra.
Usaremos o Price Action Lab para projetar a máquina um sistema de comércio de SPY que será composto por uma série de padrões de preços de curto prazo. O fechamento das barras diárias será usado como preditor de preço com um período máximo de 9 barras. A amostra de dados disponível desde o início deste ETF é dividida da seguinte forma:
Na amostra: 29/01/1993 - 31/12/2008 Fora da amostra 01/02/2009 - 02/04/2015.
A taxa de ganho mínima necessária para cada um dos padrões é de 85%. O objetivo do lucro é fixado em 2% porque gostaríamos de evitar, tanto quanto possível, as saídas dos dados. O stop-loss é definido como 4% com base na exigência de um fator de lucro mínimo de 1,5 por padrão identificado na amostra. Também exigimos que cada padrão na amostra tenha mais de 20 negociações e não mais do que 7 perdedores consecutivos. Abaixo está o espaço de trabalho para o design da máquina em amostra:
Cada linha nos resultados corresponde a um padrão de preço que satisfaça os parâmetros de desempenho especificados pelo usuário. O trade on é o ponto de entrada, neste caso o Open da próxima barra. P é a taxa de sucesso do padrão, PF é o fator lucro, Trades é o número de negociações históricas, CL é o número máximo de perdedores consecutivos, Tipo é LONGO para padrões longos e SHORT para padrões curtos, Alvo é a meta de lucro, Stop é o stop-loss e C indica% ou pontos para as saídas, neste caso, é%. Última data e primeira data são a última e primeira data no arquivo de dados históricos.
O laboratório de ação de preço identificou 30 padrões distintos que satisfaziam os critérios especificados no espaço de trabalho, 23 longos e 7 curtos. Uma vez que o bom desempenho é garantido na amostra por design, continuaremos com testes fora da amostra. Nós apenas mencionamos que, na amostra, o retorno anual composto foi de 22% eo índice de Sharpe foi de 2,57.
Em seguida, o código Amibroker foi gerado para os padrões de preços e eles foram combinados com o operador OR em um sistema de negociação final.
Os resultados do backtest no out-of-sample são mostrados abaixo:
A curva de equidade é aceitável, embora abaixo de comprar e manter (dados não ajustados). No entanto, não devemos esperar que um único sistema supere o buy and hold, especialmente quando há uma forte tendência nos últimos dois anos. O retorno anual composto é de 9,84%, o retorno líquido é de 79,76%, máx. rebaixamento é de -14,92%, o fator de lucro é de 1,47 e o índice de Sharpe é de 1. Um total de 150 negócios foram gerados no out-of-sample, 109 long e 41 short. Os negócios curtos contribuíram com cerca de 4,8% para o retorno anual composto. Observe que a comissão de US $ 0,01 por ação foi incluída no teste e o capital inicial foi de $ 100K. O capital foi totalmente investido a cada nova posição.
Os resultados aceitáveis no out-of-sample não são suficientes para proteger contra erros do tipo III. Isso é verdade porque o processo de design da máquina testou muitos sistemas no in-sample antes de oferecer um resultado final. São necessários testes adicionais. Como a validação cruzada em k-fold e outros métodos de particionamento de dados são difíceis de aplicar no caso de sistemas de negociação, recorreremos a testes de aleatorização e testes sobre títulos comparáveis, mas anti - correlacionados.
Abaixo está a distribuição dos retornos líquidos de 20.000 sistemas de negociação SPY long / short aleatórios que iniciam posições no fechamento da barra diária no out-of-sample com base no resultado de um sorteio justo (heads = long, tails = short) . As posições longas são fechadas quando as caudas sobem e as posições curtas são fechadas quando as cabeças aparecem. O capital de partida é de US $ 100K, a comissão é fixada em US $ 0,01 por ação e o patrimônio líquido é totalmente investido em cada posição:
O retorno líquido de 79,76% na saída da amostra do sistema projetado pela máquina para SPY obtém valores superiores a 96,09% dos sistemas aleatórios, resultando em um valor p de 0,0391. Portanto, dado que a hipótese nula é verdadeira, a probabilidade de obter o retorno testado no out-of-sample por acaso é de cerca de 4%. Mas é mesmo? A resposta é que talvez não seja e seja realmente maior. Precisamos de validação adicional.
Um teste de validação cruzada estrita.
Como o nosso sistema foi desenvolvido realizando essencialmente vários testes, a análise de aleatorização acima é um primeiro passo para descartar erros do Tipo III, mas isso não é suficiente. Podemos usar essa análise para economizar tempo no sentido de que, se o valor p for superior a 0,05, podemos então rejeitar o sistema. Mas um alto valor de p não exclui um sistema falso devido a testes múltiplos, ou seja, um sistema que teve a sorte de passar no teste de randomização.
Com o objetivo de aumentar as chances de que nosso resultado não seja espúrio, identificaremos uma segurança anti-correlacionada no período fora da amostra e testaremos o sistema. Um bom candidato para este teste é o TLT, conforme mostrado abaixo:
A correlação média de 120 dias de SPY e TLT durante o período fora da amostra foi de -0,34 com um período de quase dois anos, que está marcado no gráfico, de alta correlação. Abaixo está o desempenho de equidade do sistema desenvolvido para SPY em dados TLT no mesmo período fora da amostra:
No caso do TLT, o sistema supera a compra e retenção com retorno anual composto de 9,43% e retorno líquido de 75,60%. Max. drawdown é -11,14% e Sharpe é 1,06 com fator de lucro igual a 1,49.
Este é um resultado significativo. Um sistema desenvolvido para o SPY funciona ainda melhor no TLT, uma segurança anti-correlacionada. Assim, a probabilidade de os padrões identificados durante a concepção da máquina ter um poder preditivo é alto. No entanto, note que este teste deve ser executado apenas uma vez. Se os resultados não forem satisfatórios, a pesquisa por outra segurança anticorrelacionada que forneça um resultado positivo ou por outro sistema que forneça um resultado positivo com o mesmo teste, introduz viés de snooping de dados e invalida a importância desses testes. O mesmo se aplica a qualquer processo que reutilize dados para executar testes em uma amostra fora da amostra. Se os dados forem reutilizados muitas vezes, a pesca de dados é garantida juntamente com resultados espúrios. Aparentemente, isso é o que prejudica os esforços de muitos desenvolvedores de sistemas que usam redes neurais e algoritmos genéticos para o meu por bordas. É também por isso que o determinismo é importante: se um sistema diferente é extraído a cada novo teste, ou existem muitos sistemas diferentes com bom desempenho, isso facilita a espionagem de dados. No entanto, com o Price Action Lab isso não é possível porque com os mesmos parâmetros, o mesmo sistema será encontrado e todos os padrões são usados para desenvolver o sistema final, ou seja, não há viés de seleção.
Abaixo está a distribuição dos retornos líquidos de 20.000 sistemas de negociação TLT aleatórios long / short que iniciam posições no fechamento de cada barra diária no out-of-sample com base no resultado de um sorteio justo (heads = long, tails = short ). O capital de partida é de US $ 100K, a comissão é fixada em US $ 0,01 por ação e o patrimônio líquido é totalmente investido em cada posição:
O retorno líquido de 75,60% do sistema projetado pela máquina para pontuações de TLT é maior que 97,47% dos sistemas aleatórios, resultando em um valor p de 0,0253. Portanto, dado que a hipótese nula é verdadeira, a probabilidade de obter o resultado do sistema fora da amostra por acaso é de cerca de 2,5%.
Conclusão.
Preditores simples de ação de preço, como o fechamento de barras diárias, ainda possuem poder preditivo, apesar de uma arbitragem contínua de oportunidades nos mercados. Isso foi demonstrado neste blog. É importante que o projeto da máquina que use um preditor simples para desenvolver um algo seja determinista; caso contrário, testes complexos devem ser usados para proteger contra erros do tipo III e pesca de dados. A complexidade dos testes necessários torna a aplicação do design da máquina com base em condições iniciais aleatórias extremamente difícil no caso do desenvolvimento do sistema de negociação. Devido à natureza determinística do algoritmo de projeto de máquina usado neste exemplo, um teste mais simples, porém rigoroso, foi usado com base no desempenho do sistema em uma segurança anti-correlacionada. No entanto, qualquer abuso desses tipos de testes torna-os ineficazes na proteção contra erros de Tipo III. Obviamente, o desenvolvimento do sistema de negociação não é fácil e está ficando mais difícil à medida que a tecnologia avança. Os comerciantes têm duas opções ao desenvolver sistemas: a primeira opção é baseada em conceber uma hipótese para testar que deve ser única, caso contrário, pode ser um artefato do viés de mineração de dados. A segunda opção envolve o uso do design da máquina. Ambas as opções têm armadilhas. A primeira opção requer unicidade e a segunda opção requer testes eficazes de validação cruzada. Pode ser o caso de uma hipótese única ter baixas chances devido à mineração de dados implacável nos últimos 25 anos usando computadores e testes de backtest.
Sobre o autor Michael Harris.
Michael Harris é um especialista em negociação e um desenvolvedor de software avançado de reconhecimento de padrões para o benefício da posição e swing traders. Michael desenvolveu o software APS Automatic Pattern Search, que recebeu grande aclamação e recentemente o Price Action Lab, um programa que inclui um indicador avançado de análise técnica baseado em padrões de preços, chamado p-Indicator. Ele também fornece serviços de consultoria sobre desenvolvimento de sistemas de negociação e análise de mercado para investidores institucionais e fundos hedge. No passado, Michael também trabalhou em várias empresas financeiras, onde desenvolveu um programa de otimização de carteiras de títulos e sistemas de negociação de commodities e commodities. estoques. Desde 1989, ele tem sido um comerciante ativo. Michael também é um autor de melhor venda. Seu primeiro livro "Short-Term Trading with Price Patterns" foi publicado em 1999. Os outros dois livros "Stock Trading Techniques with Price Patterns" e "Rentabilidade e negociação sistemática" foram publicados em 2000 e 2008, respectivamente.
Posts Relacionados.
A temporada de Natal é alcista para os mercados dos EUA?
Estratégia quebrada ou mudança de mercado: investigação de desempenho insuficiente.
Descobrindo o que funciona, e o que não funciona.
A ideia de fazer um teste fora da amostra com uma série anti-correlacionada é excelente porque podemos ver como uma estratégia funciona em um mercado diferente. IMO é um teste difícil de passar em muitos casos, mas uma quebra completa do desempenho deve fornecer uma indicação de que algo pode estar errado com a estratégia original.
Jeff, seria legal se você pudesse incluir alguns testes com essa ideia em um artigo futuro. Seria interessante ver o que você veio e suas conclusões.
Olá Rick. Esta é uma ideia interessante para um teste e eu concordo que parece ser um teste difícil de passar. No entanto, com base na minha compreensão do artigo, este tipo de teste é adequado para sistemas de negociação projetados por máquinas. Eu ainda projeto sistemas da maneira antiga. Eu tento entender o mercado e construir sistemas em torno de bordas que observo ou outras que apontam para mim. Então, não tenho certeza de quão prático seria para o meu processo de desenvolvimento.
Em um pensamento diferente, eu gosto do Teste de Randomização e isso aplica-se ao desenvolvimento do meu sistema. Eu acho que a computação de um valor p baseado na comparação do desempenho do seu sistema de negociação dado versus uma distribuição dos retornos líquidos de sistemas gerados aleatoriamente fornece valor.
Olá Jeff e Rick,
Os testes de aleatorização podem ser úteis desde que sejam realizados em dados não vistos ou em dados de títulos comparáveis. Note que os sistemas over-fitted quase sempre passam esses testes em dados in-sample e também outros testes similares, como Monte Carlo, por exemplo. Por conseguinte, tais testes podem ser utilizados em apoio da hipótese nula, isto é, apenas para rejeição do sistema.
Isn & # 8217; t Kevin Davey basicamente falando sobre um teste de aleatorização, também, quando ele discute comparação contra & # 8220; Entradas / saídas de macaco? & # 8221;
Eu não estou familiarizado com o trabalho que você mencionou, mas os testes de randomização são comuns. Eles podem assumir formas diferentes porque existe liberdade na definição da hipótese nula e da estatística de teste. O raciocínio por trás dos meus testes é que, se o desempenho de um sistema não for melhor que o de pelo menos 95% dos sistemas aleatórios, então a probabilidade de eu lidar com um resultado espúrio é alta. Eu uso o teste de randomização no meu software Price Action Lab porque os resultados de um lance de moeda têm características semelhantes às obtidas com a negociação de padrões de preços. No entanto, todos os testes estão sujeitos a erros e os resultados dependem da aplicação adequada. Esses testes podem não ser aplicados em alguns casos. Eu também evito o & # 8220; macaco de entrada / saída & # 8221; terminologia porque não tenho ideia de se os macacos são tendenciosos ou não devido a certos fatores conhecidos ou desconhecidos.
Por que um p-valor? Conforme o ASA, os valores de P não medem a probabilidade de que a hipótese estudada seja verdadeira, ou a probabilidade de que os dados foram produzidos por acaso aleatório sozinho. Por si só, um valor de p não fornece uma boa medida de evidência em relação a um modelo ou hipótese. Conclusões científicas e decisões de negócios ou políticas não devem basear-se apenas em um valor p ou um limite específico. & # 8221;
Eu acho que um valor-p é precisamente a probabilidade de que os dados foram produzidos a partir do acaso aleatório, se comparado a uma distribuição normal aleatória. Você pode estar citando o ASA fora de contexto.
Se um teste OOS em uma série não correlacionada gera um desempenho fraco, então não poderia simplesmente olhar para um sistema de negociação que funciona bem em um mercado, mas mal em outro?
Olá Mark. Absolutamente, mas também é possível que tenhamos um sistema espúrio. Uma validação cruzada em dados anti-correlacionados é um teste rigoroso que pode oferecer evidências contra resultados espúrios. No entanto, todos os testes estão sujeitos a erros.
Publicações populares.
Connors 2-Period RSI Update para 2013.
Este indicador simples faz dinheiro novamente e novamente.
The Ivy Portfolio.
Melhorando a Estratégia de Identidade Simples, Parte 1.
Copyright © 2011-2018 pela Capital Evolution LLC. - Projetado por temas Thrive | Powered by WordPress.
Por favor faça login novamente. A página de login será aberta em uma nova janela. Depois de efetuar o login, você pode fechá-lo e retornar a esta página.
Validação para o Sistema de Negociação de Fornecedores.
Se for bom, eles trocarão.
"Infelizmente, ninguém pode ser informado sobre o que é Matrix. Você tem que ver por si mesmo. & Quot;
Grande filme, um dos melhores de todos os tempos, na minha opinião. Mudança de vida se você realmente entender e digerir com os olhos abertos e uma mente aberta,
. todos eles se aplicam à vida e ao sucesso - e na negociação também,
2. Não troque com dinheiro real.
3. Eles podem ter uma pequena conta e não são muito orgulhosos dela. Por quê? Porque a maioria de sua renda vem de ser um fornecedor e não de negociação.
4. Qualquer combinação dos 3 acima.
Além disso, um desenvolvedor de sistemas pode não ter outro capital para viver um sistema que ele desenvolveu. Ele pode ter bons resultados no teste de volta e bons resultados em sim ao vivo, mas realmente não tem fundos para trocar o sistema. Este pode ser o meu caso, eu estou com pouco capital agora, mas eu estou aprendendo que eu gosto do estilo de negociação sistemática e me movendo em direção à automação.
Além disso, um desenvolvedor de sistemas pode não ter outro capital para viver o comércio de um sistema que ele desenvolveu. Ele pode ter bons resultados no teste de volta e bons resultados em sim ao vivo, mas realmente não tem fundos para trocar o sistema. Este pode ser o meu caso, eu estou com pouco capital agora, mas eu estou aprendendo que eu gosto do estilo de negociação sistemática e me movendo em direção à automação.
Na verdade, é realmente fácil, as pessoas estarão ansiosas para gastar dinheiro com você.
Mas aposte maior quando ganhar dinheiro.
Diga que esteja preparado para arriscar retirar 5 a 10% do capital inicial, mas talvez 25% quando você tiver uma almofada de lucro saudável.
Não precisa ser lucrativo a cada mês, mas o mês vencedor médio deve ser maior do que o mês perdido em média.
Na verdade, é realmente fácil, as pessoas estarão ansiosas para jogar dinheiro com você.
Você precisa mostrar resultados de testes de volta realistas, como o lucro variou todos os meses no passado.
E alguns meses de negociação real também.
Não arrisque o dinheiro de outras pessoas se você não tiver certeza de que pode realmente ganhar no longo prazo.
Você precisa mostrar resultados de testes de volta realistas, como o lucro variou todos os meses no passado.
E alguns meses de negociação real também.
Não arrisque o dinheiro de outras pessoas se você não tiver certeza de que pode realmente ganhar no longo prazo.
Trader Tech Talk 010: Howard Bandy e Validação do Sistema de Negociação.
Tenho uma entrevista fantástica para você hoje! Hoje temos conosco o Dr. Howard Bandy. Eu já estive lendo meu blog por algum tempo, você sabe que sou um grande fã do trabalho do Dr. Bandy & # 8217; s. Dr. Bandy escreveu três livros de desenvolvimento de sistemas comerciais muito excelentes, e estou tão honrado que ele conseguiu comparecer no show.
Neste episódio, você aprenderá.
Como superar as dificuldades no teste de volta Como validar seu sistema de negociação e mostrar estatisticamente que ele continuará trabalhando no futuro O que você não deve codificar em seu sistema de negociação.
Aqui estão os recursos para o show de hoje:
O Dr. Bandy também forneceu uma lista de leitura de livros para nós, relacionados ao comércio, desenvolvimento de sistemas e modelagem matemática:
Sam Savage, A Falha das Médias. Por que planos baseados em médias são muitas vezes errados. Daniel Kahneman, pensando, rápido e lento. Onde podemos e não podemos confiar em nossas intuições. Nate Silver, o sinal e o ruído. Por que tantas previsões falham. Michael Mauboussin, The Success Equation. Distinguir entre habilidade e sorte. Leonard Mlodinow, The Drunkard's Walk. Como a aleatoriedade governa nossas vidas. John Haigh, Taking Chances. Usando probabilidade de ajudar a tomar decisões. Emanuel Derman, Modelos. Comportamento. Seriamente . Como os modelos financeiros quantitativos foram usados e mal utilizados. Christopher Chabris e Daniel Simons, The Invisible Gorilla. Como nossas intuições nos enganam.
Estou certo de que você realmente vai gostar desse episódio!
Trackbacks.
[& # 8230;] Al Brooks insiste que os mercados são o movimento browniano. Pergunto-me é que ele diz isso porque ele não sabe ou. porque ele [& # 8230;]
Howard Bandy discute a validação do sistema de negociação, sistemas de reversão média e seus três livros, Sistemas de Negociação Quantitativos, Sistemas de Negociação de Reversão Média e Desempenho do Sistema de Negociação de Modelagem. [& # 8230;] blog. tradertechtalk / 10. [& # 8230;]
Deixe uma resposta Cancelar resposta.
Postagens recentes.
Publicação destacada.
Podcast: jogue na nova janela | Download | Incorporado no episódio 21 do podcast do Trader Tech Talk, Kathy Lien é nosso primeiro convidado na & # 8220; Women of Finance & # 8221; Series! Bem-vindo, Kathy! Kathy nos fala sobre sua jornada no comércio, como ela começou e como conseguiu começar a trabalhar [& hellip;]
Sistemas de Negociação Baseados no Modelo Preditivo Parte II.
A idéia fundamental por trás da modelagem preditiva é que os indicadores podem conter informações que podem ser usadas para prever uma variável prospectiva, chamada de alvo. A tarefa de um modelo preditivo é encontrar e explorar qualquer informação desse tipo.
Data volatilidade day_return.
19950214 0,251 1,572 0,144.
19950215 0,101 1,778 0,055.
19950216 -0,167 2,004 -0,013.
Suponhamos que nós fornecemos vários anos desses dados para um modelo e pedimos que ele aprenda a prever day_return, o retorno do dia de um dia, de dois indicadores, um chamado tendência e a outra volatilidade. Na linguagem da aprendizagem por máquina, esse processo é chamado de treinamento modelo. Então, podemos calcular em uma data posterior, a partir de preços recentes, essa tendência = 0,225 e a volatilidade = 1,244 a partir desse dia. O modelo treinado pode então fazer uma previsão de que a variável alvo day_return será 0.152. (Estes são todos os números inventados). Com base nesta previsão de que o mercado está prestes a aumentar substancialmente, podemos optar por assumir uma posição longa.
Convertendo Previsões para Decisões Comerciais.
A intuição nos diz que devemos colocar mais fé em previsões extremas do que em previsões mais comuns perto do centro do intervalo de previsão do modelo. Se um modelo prevê que o mercado aumentará em 0,001% amanhã, não estaríamos tão inclinados a assumir uma posição comprada como se o modelo previsse um aumento de 5,8%. Esta intuição está correta, porque nossa pesquisa mostrou que, em geral, existe uma grande correspondência entre a magnitude de uma previsão e a probabilidade de sucesso do comércio associado. As previsões de grande magnitude são mais propensas a sinalizar movimentos lucrativos do mercado do que as previsões de pequena magnitude. O método padrão para tomar decisões comerciais com base em movimentos de mercado previstos é comparar a previsão com um limite fixo. Se a previsão for maior ou igual a um limite superior (geralmente positivo), tome uma posição longa. Se a previsão for menor ou igual a um limite inferior (geralmente negativo), tome uma posição curta. O período de espera para uma posição está implícito na definição do alvo. Isso será discutido em detalhes em nosso livro Statistically Sound Machine Learning para Algorithmic Trading of Financial Instruments (SSML). Deve ser óbvio que o limite determina uma compensação no número de trades em relação à taxa de precisão das negociações. Se estabelecemos um limite próximo de zero, a magnitude das previsões excederá freqüentemente o limite, e uma posição será tomada com freqüência. Tais negociações trazem uma taxa de falha relativamente alta. Por outro lado, se definirmos um limiar que esteja longe de zero, os movimentos previstos do mercado apenas raramente estarão além do limite, portanto, os negócios serão raros, mas terão uma taxa de sucesso relativamente alta. Nós já observamos que há uma grande correspondência entre a magnitude de uma previsão e a probabilidade de sucesso comercial. Assim, escolhendo um limite apropriado, podemos controlar se temos um sistema que negocie com frequência, mas com precisão medíocre, ou um sistema que negocie raramente, mas com excelente precisão.
O TSSB escolhe automaticamente os limites ótimos, longos e curtos, escolhendo-os de modo a maximizar o fator de lucro para sistemas longos e sistemas curtos separadamente. Fator de lucro, uma métrica comum de desempenho do sistema de negociação é a relação entre os ganhos totais em negócios bem-sucedidos e o total de perdas em negócios com falha. Para prevenir situações degeneradas em que existe apenas um comércio ou muito poucos negócios, o usuário especifica um número mínimo de negociações que devem ser tomadas, seja como um número absoluto ou como uma fração mínima de barras. Além disso, o TSSB tem a opção de usar dois limites de cada lado (longo e curto) para produzir dois conjuntos de sinais, um definido para negociações de "confiabilidade normal" e um conjunto mais conservador para negociações de "alta confiabilidade". Finalmente, em muitas aplicações, o TSSB imprime tabelas que mostram figuras de desempenho que seriam obtidas com diferentes limiares.
A computação de limites e a interpretação dos resultados comerciais com base em previsões relativas a esses limites são tópicos avançados que serão discutidos em detalhes no SSML. Por enquanto, o leitor precisa entender apenas os seguintes conceitos:
O usuário especifica as variáveis dos indicadores com base no histórico observado e nas variáveis de destino que retratam o movimento de preços futuro. O TSSB recebe dados históricos cruciais do mercado (preços e talvez outros dados, como volume) e gera um extenso banco de dados de indicadores e variáveis alvo. Um ou mais modelos são treinados para prever o alvo com um conjunto de indicadores. Em outras palavras, o modelo aprende a usar a informação preditiva contida nos indicadores para prever o futuro como exemplificado pelo alvo. Toda vez que uma previsão é feita, o valor numérico desta predição é comparado a um limite longo ou superior. Se a previsão for maior ou igual ao limiar longo, uma posição longa é tomada. Da mesma forma, a predição é comparada a um limiar curto ou menor, que quase sempre será menor que o limite longo. Se a previsão for menor ou igual ao limite curto, uma posição curta é tomada. O período de espera para uma posição é inerente à variável de destino. Isso é discutido em detalhes no SSML. O TSSB reportará os resultados para sistemas longos e curtos separadamente, bem como resultados líquidos para os sistemas combinados.
Testando o Sistema de Negociação.
O TSSB fornece a capacidade de executar muitos testes de um sistema de negociação ou filtragem de modelos preditivos. As metodologias de teste disponíveis serão discutidas em detalhes SSML. No entanto, para que o leitor possa compreender o desenvolvimento e a avaliação do sistema de negociação / filtragem elementar apresentados no próximo capítulo, discutiremos agora duas metodologias gerais de teste: validação cruzada e teste de walkforward. Estes são os principais padrões em muitas previsões.
aplicativos, e ambos estão disponíveis no TSSB em uma variedade de formas.
O princípio subjacente à grande maioria das metodologias de teste, incluindo as incluídas no TSSB, é que o conjunto de dados histórico completo disponível para o desenvolvedor é dividido em subconjuntos separados. Um subconjunto, chamado conjunto de treinamento ou o conjunto de desenvolvimento, é usado para treinar o modelo preditivo. O outro subconjunto, denominado conjunto de teste ou conjunto de validação, é usado para avaliar o desempenho do modelo treinado. (Observe que a distinção entre o conjunto de testes de termos e o conjunto de validação não é consistente entre os especialistas, de modo que a convenção cada vez mais comum é usá-los de forma intercambiável. O mesmo se aplica ao conjunto de treinamento e ao conjunto de desenvolvimento).
A chave aqui é que nenhum dado que participa no treinamento do modelo é permitido participar de sua avaliação de desempenho. Em condições bastante gerais, esta separação mutuamente exclusiva garante que o desempenho medido no conjunto de teste é uma estimativa imparcial do desempenho futuro. Em outras palavras, embora o desempenho observado quase certamente não seja exatamente igual ao desempenho que será visto no futuro, ele não tem um viés sistemático em relação a valores otimistas ou pessimistas. Ter uma estimativa imparcial do desempenho futuro é um dos dois principais objetivos de uma operação de desenvolvimento e teste do sistema comercial. O outro objetivo é ser capaz de realizar um teste de significância estatística para estimar a probabilidade de que o nível de desempenho alcançado possa ter sido devido à boa sorte. Este conceito avançado está além do escopo desta breve visão geral, mas é discutido em profundidade no SSML.
Nos primeiros dias de construção e teste de modelos, quando os computadores de alta velocidade não estavam prontamente disponíveis, a divisão dos dados em um conjunto de treinamento e um conjunto de testes era feita exatamente uma vez. O desenvolvedor tipicamente treinaria o modelo usando dados durante uma data vários anos antes da data atual e depois testaria o modelo em dados subseqüentes, terminando com os dados mais recentes disponíveis. Este é um uso extremamente ineficiente dos dados. O TSSB disponibiliza testes de validação cruzada e walkforward. Essas técnicas dividem os dados disponíveis em conjuntos de treinamento e conjuntos de teste muitas vezes e agrupam as estatísticas de desempenho em uma única estimativa imparcial da verdadeira capacidade do sistema comercial baseado no modelo. Esta reutilização extensiva dos dados para treinamento e testes faz uso eficiente do histórico de mercado precioso e limitado.
Teste de Walkforward.
O teste Walkforward é direto, intuitivo e amplamente usado. O princípio é que treinamos o modelo em um bloco relativamente longo de dados que termina um tempo considerável no passado. Testamos o modelo treinado em uma seção relativamente curta de dados que segue imediatamente o bloco de treinamento. Em seguida, mudamos os blocos de treinamento e testes para a frente no tempo por um montante igual ao comprimento do bloco de teste e repita as etapas anteriores. O teste Walkforward termina quando chegamos ao final do conjunto de dados. Calculamos o valor do desempenho líquido agrupando todas as negociações do bloco de teste. Aqui está um exemplo simples de teste walkforward:
1) Treine o modelo usando dados de 1990 a 2007. Teste o modelo em dados de 2008.
2) Treine o modelo usando dados de 1991 a 2008. Teste o modelo em dados de 2009.
3) Treine o modelo usando dados de 1992 a 2009. Teste o modelo em dados de 2010.
Agrupar todas as negociações dos testes de 2008, 2009 e 2010. Essas negociações são usadas para calcular uma estimativa imparcial do desempenho do modelo.
A principal vantagem do teste walkforward é que ele imita a vida real. A maioria dos desenvolvedores de sistemas de negociação automatizados periodicamente reciclam ou refinam seu modelo. Assim, os resultados de um teste walkforward simulam os resultados que teriam sido obtidos se o sistema tivesse sido negociado. Este é um argumento convincente a favor desta metodologia de testes.
Outra vantagem do teste walkforward é que reflete corretamente a resposta do modelo à não-estacionária no mercado. Todos os mercados evoluem e mudam seu comportamento ao longo do tempo, às vezes girando através de vários regimes diferentes. Percebendo, essa mudança na dinâmica do mercado e, portanto, nas relações entre o indicador e as variáveis alvo, é chamada de não-estacionária. Os melhores modelos preditivos têm um grau significativo de robustez contra tais mudanças, e o teste walkforward nos permite avaliar a robustez de um modelo.
A capacidade do TSSB de usar uma variedade de comprimentos de blocos de teste facilita avaliar a robustez de um modelo em relação à não-estacionariedade. Suponha que um modelo alcance excelentes resultados de walkforward quando o bloco de teste é muito curto. Em outras palavras, o modelo nunca é solicitado a fazer previsões de dados que ultrapassam a data em que o bloco de treinamento terminou. Suponha agora que o desempenho avançado se deteriora se o bloco de teste for feito por mais tempo. Isso indica que o mercado está mudando rapidamente de maneiras que o modelo não é capaz de manipular. Esse modelo é arriscado e exigirá uma reconversão frequente se for manter-se a par das condições atuais do mercado. Por outro lado, se o desempenho walkforward se mantiver bem com o aumento do comprimento do bloco de teste, o modelo é robusto contra a não-estacionariedade. Este é um atributo valioso de uma abordagem baseada em modelos preditivos para o desenvolvimento de sistemas de negociação. Olhe para a Figura 1 na próxima página, que descreve a colocação dos blocos de treinamento e teste (períodos) ao longo do eixo do tempo. A Figura 1 acima mostra duas situações.
A seção superior da figura retrata walkforward com blocos de teste muito curtos. A seção inferior mostra blocos de teste muito longos. Pode ser útil executar vários testes walkforward de comprimentos variados de blocos de teste, a fim de avaliar o grau em que o modelo de previsão é robusto contra a não-estacionariedade.
O teste Walkforward tem apenas uma desvantagem em relação aos métodos de teste alternativos, como a validação cruzada: é relativamente ineficiente quando se trata de usar os dados disponíveis. Somente casos após o final do primeiro bloco de treinamento são usados para testar. Se você estiver disposto a acreditar que os indicadores e metas são razoavelmente estacionários, trata-se de um trágico desperdício de dados. A validação cruzada, discutida na próxima seção, aborda essa fraqueza.
Validação cruzada.
Em vez de segregar todos os casos de teste no final do bloco de dados históricos, como é feito com o teste walkforward, podemos distribuí-los uniformemente por todo o histórico disponível. Isso é chamado de validação cruzada. Por exemplo, podemos testar da seguinte maneira:
1) Treinar usando dados de 2006 a 2008. Teste o modelo em dados de 2005.
2) Treinar usando dados de 2005 a 2008, excluindo 2006. Teste o modelo em dados de 2006.
3) Treinar usando dados de 2005 a 2008, excluindo 2007. Teste o modelo em dados de 2007.
4) Treinar usando dados de 2005 a 2008, excluindo 2008. Teste o modelo em dados de 2008.
Essa idéia de retenção de blocos de dados internos de "teste" durante o treinamento com os dados circundantes é ilustrada na Figura 2 abaixo. Na validação cruzada, cada etapa é comumente chamada de dobra.
A vantagem óbvia da validação cruzada sobre o teste walkforward é que cada caso disponível torna-se um caso de teste em algum ponto. No entanto, existem várias desvantagens a serem observadas. O problema potencial mais grave é que a validação cruzada é sensível à não-estacionária. Em um teste de walkforward, apenas casos relativamente recentes servem como assuntos de teste. Mas na validação cruzada, os casos todo o caminho de volta ao início do conjunto de dados contribuem para testar resultados de desempenho. Se o comportamento do mercado em dias iniciais fosse tão diferente do que em dias posteriores, a relação entre os indicadores eo alvo mudou seriamente, não é recomendável incorporar resultados de testes desses primeiros dias.
Outra desvantagem é mais filosófica do que prática, mas é digna de nota. Unlike a walkforward test, cross validation does not mimic the real-life behavior of a trading system. In cross validation, except for the last fold, we are using data from the future to train the model being tested. In real life this data would not be known at the time that test cases are processed. Some skeptics will raise their eyebrows at this, even though when done correctly it is legitimate, providing nearly unbiased performance estimates. Finally, overlap problems, discussed in the next section, are more troublesome in cross validation than in walkforward tests.
The discussions of cross validation and walkforward testing just presented assume that each case is independent of other cases. In other words, the assumption is that the values of variables for a case are not related to the values of other cases in the dataset. Unfortunately, this is almost never the situation. Cases that are near one another in time will tend to have similar values of indicators and/or targets. This generally comes about in one or both of the following ways:
Many of the targets available in TSSB look further ahead than just the next bar. For example, suppose our target is the market trend over the next ten bars. This is the quantity we wish to predict in order to make trade decisions. If this value is high on a particular day, indicating that the market trends strongly upward over the subsequent ten days, then in all likelihood this value will also be high the following day, and it was probably high the prior day. Shifting ahead or back one day still leaves an overlap of nine days in that ten-day target window. Such case-to-case correlation in time series data is called serial correlation. In most trading systems, the indicators look back over a considerable time block. For example, an indicator may be the market trend over the prior 50 days, or a measure of volatility over the prior 100 days. As a result, indicators change very slowly over time. The values of indicators for a particular day are almost identical to the values in nearby days, before and after.
These facts have several important implications. Because indicators change only slowly, the model’s predictions also change slowly. Hence market positions change slowly; if a prediction is above a threshold, it will tend to remain above the threshold for multiple bars. Conversely, if a prediction is below a threshold, it will tend to remain below that threshold for some time. If the target is looking ahead more than one bar, which results in serial correlation as discussed above, then the result of serial correlation in both positions and targets is serial correlation in returns for the trading system. This immediately invalidates most common statistical significance tests such as the t-test, ordinary bootstrap, and Monte-Carlo permutation test. TSSB does include several statistical significance tests that can lessen the impact of serial correlation. In particular, the stationary bootstrap and tapered block bootstrap will be discussed elsewhere in SSML . Unfortunately, both of these tests rely on assumptions that are often shaky. We’ll return to this issue in more detail later when statistical tests are discussed. For the moment, understand that targets that look ahead more than one bar usually preclude tests of significance or force one to rely on tests having questionable validity.
Lack of independence in indicators and targets has another implication, this one potentially more serious than just invalidating significance tests. The legitimacy of the test results themselves can be undermined by bias. Luckily, this problem is easily solved with a TSSB option called OVERLAP. Its details are discussed in SSML. For now we will simply explore the nature of the problem.
The problem occurs near the boundaries between training data and test data. The simplest situation is for walkforward testing, because there is only one (moving) boundary. Suppose the target involves market movement ten days into the future. Consider the last case in the training block. Its target involves the first ten days after the test block begins. This case, like all training set cases, plays a role in the development of the predictive model. Now consider the case that immediately follows it, the first case in the test block. As has already been noted, its indicator values will be very similar to the indicator values of the prior case. Thus, the model’s prediction will also be similar to that of the prior case. Because the target looks ahead ten days and we have moved ahead only one day, leaving a nine-day overlap, the target for this test case will be similar to the target for the prior case. But the prior case, which is practically identical to this test case, took part in the training of the model! So we have a strong prejudice for the model to do a good job of predicting this case, whose indicators and target are similar to the training case. The result is optimistic bias, the worst sort. Our test results will exceed the results that would have been obtained from an honest test.
This boundary effect manifests itself in an additional fashion in cross validation. Of course, we still have the effect just described when we are near the end of the early section of the training set and the start of the test set. This is the left edge of the red regions in Figure 2. But we also have a boundary effect when we are near the end of the test set and the start of the later part of the training set. This is the right edge of each red region. As before, cases near each other but on opposite sides of the training set / test set boundary have similar values for indicators and the target, which results in optimistic bias in the performance estimate. The bottom line is that bias due to overlap at the boundary between training data and test data is a serious problem for both cross validation and walkforward testing. Fortunately, the user can invoke the OVERLAP option to alleviate this problem.
Get the Book.
& # 8212; By David Aronson.
David Aronson is a pioneer in machine learning and nonlinear trading system development and signal boosting/filtering. Aronson is Co-designer of TSSB (Trading System Synthesis and Boosting) a software platform for the automated development of statistically sound predictive model based trading systems. He has worked in this field since 1979 and has been a Chartered Market Technician certified by The Market Technicians Association since 1992. He was an adjunct professor of finance, and regularly taught to MBA and financial engineering students a graduate-level course in technical analysis, data mining and predictive analytics. His recently released book, Statistically Sound Machine Learning for Algorithmic Trading of Financial Instruments, is a in-depth look at developing predictive-model-based trading systems using TSSB.
Sobre o autor System Trader Success Contributor.
Os autores contribuintes são participantes ativos nos mercados financeiros e totalmente absorvidos na análise técnica ou quantitativa. Eles desejam compartilhar suas histórias, idéias e descobertas no System Trader Success e espero que você seja um comerciante do sistema melhor. Entre em contato conosco se você quiser ser um autor contribuidor e compartilhar sua mensagem com o mundo.
Posts Relacionados.
Você está perdendo quando você deveria ganhar? Aqui está algo que você pode estar perdendo.
A temporada de Natal é alcista para os mercados dos EUA?
Estratégia quebrada ou mudança de mercado: investigação de desempenho insuficiente.
I think is what should be proven, not assumed. I saw no proof of this.
“Conversely, if we set a threshold that is far from zero, predicted market moves will only rarely lie beyond the threshold, so trades will be rare but have a relatively high success rate.”
If this is by design of the algorithm, then this may be fitting. But again this must be proven, not assumed.
Unless the above are proven there is a lot of wishful thinking involved here. I see a lot of hand waiving.
Adding to your comment Bob,
I’d like to know is what exactly is tested here? Is it:
a) an entry signal?
= & gt; Whether or not a “large” moves is typically followed by that signal.
b) a trading system’s rule set?
= & gt; Not only the entry matters, but also the price path until the exit as it influences the movement of stops as well as profit taking exit(s).
If it is b) then it could very well be that smaller moves allow for tighter initial stops thus actually providing a higher risk multiple & average profit per trade than big moves, that may be a lot more volatile (i. e., max. adverse excursion) and thus requiring larger initial stops.
So coming back to the “large correspondence between the magnitude of a prediction and the likelihood of success of the associated trade. Predictions of large magnitude are more likely to signal profitable market moves than predictions of small magnitude.”
To me “likelihood of success” sounds like “win-rate”, but that’s different from expectancy, which is probably meant by “profitable market moves”. But maybe I am misinterpreting those words.
Thanks for any further insights!
What is being tested is a trading system based on a predictive model . In contrast to a rules based system where the rules are proposed by a human analyst, trading systems developed with TSSB are based on a statistical model that uses one or more indicators to predict a forward looking target variable. The target can be deifine in many different ways; forward return, hitting a price objective before a stop-loss point, etc. The trading system uses a simple threshold logic where larger predictions are presumed to have a greater likelihood of being accurate. Our research shows this to be the case. Thus a signal to go long or go short is triggered when the prediction exceeds an upper or lower threshold. During TSSB’s development of the trading system both the predictive model and the signal triggering threshold are designed to maximize the Profit Factor of the trading system.
So what is being tested is the profit factor produced by the combination of the predictive model and the signal thresholds.
“likelihood of success” refers to the likelihood of getting a profitable trading system.
Thanks from a great blog. See my comments on Part 1. Did you read the interesting paper of Lopezdeprado and what is your view on his test for datasnooping/overfitting?
Hi David and others.
I’m interested in developing forex trading systems and my questions to you are the following:
1. Is TSSB ideal for forex too? Are there any contraindications using it for experimenting forex systems?
2. What about your book (SSML)? Is is contains the same value for forex as for stocks trading?
Desde já, obrigado!
Bela, it’s my opinion that TSSB and SSML (which is a textbook on using TSSB) is relevant to any market. TSSB is a tool used to help discover trading models, so it’s not limited to what it can be applied to.
I recently bought the book and downloaded the TSSB software. I managed to load a EUR/USD dataset and train a model. Even though i know about Machine Learning and being a programmer myself i failed to understand the simplest of all : How TSSB prompts for a trading decision. Unfortunately the Book is not clear on this and more work is warranted so that a novice can get a grasp on the simplest of things and then going on to more difficult model implementations. If anyone knows more about this please send me an email : hgwelec [at] y a h o o . c o m.
I think TSSB is a really good academic tool. I write ‘academic’ because although I have found promising trading systems I am unable to convert them into EasyLanguage or C#. It would be really helpful if some guidance could be given about this otherwise TSSB is ‘just pie in the sky’, that is, you discover promising systems which can never be deployed.
Publicações populares.
Connors 2-Period RSI Update para 2013.
Este indicador simples faz dinheiro novamente e novamente.
The Ivy Portfolio.
Melhorando a Estratégia de Identidade Simples, Parte 1.
Copyright © 2011-2018 pela Capital Evolution LLC. - Projetado por temas Thrive | Powered by WordPress.
Por favor faça login novamente. A página de login será aberta em uma nova janela. Depois de efetuar o login, você pode fechá-lo e retornar a esta página.
US Search Mobile Web.
Bem-vindo ao fórum Yahoo Search! Nós adoramos ouvir suas idéias sobre como melhorar a Pesquisa do Yahoo.
O fórum de comentários do produto do Yahoo agora requer uma ID e senha de Yahoo válidas para participar.
Agora você precisa fazer o login usando sua conta de e-mail do Yahoo para nos fornecer feedback e enviar votos e comentários às ideias existentes. Se você não possui uma ID do Yahoo ou a senha para sua ID do Yahoo, inscreva-se para uma nova conta.
Se você tiver uma ID e senha de Yahoo válidas, siga estas etapas, se desejar remover suas postagens, comentários, votos e / ou perfil no fórum de comentários do produto do Yahoo.
Vote em uma ideia existente () ou publique uma nova ideia ...
Ideias quentes Principais ideias Novas ideias Categoria Estado Meus comentários.
Quando busco meu nome, você publica resultados estranhos. As duas imagens que são eu foram removidas de um site que eu encerrei. Remover.
Ao pesquisar meu nome, estranha propaganda de imagens de palhaço vem para o capitão o palhaço em outro estado, REMOVA-O.
e as imagens.
Todas as coisas tentando implicar coisas estranhas.
O Yahoo pode desenvolver a opção para imagens serem vistas como uma apresentação de slides? Isso ajudaria em vez de ter que percorrer cada imagem e tornar esta experiência do Yahoo mais agradável. Obrigado pela sua consideração.
Não vê a sua ideia? Publique uma nova ideia ...
US Search Mobile Web.
Feedback e Base de Conhecimento.
Dê retorno.
Deutschland Finanzen Mobile DF iOS 1 ideia España Finanzas Mobile DF iOS 7 ideias Contas Painel 33 ideias Opinião do anúncio 3 ideias Respostas TH 31 idéias Respostas TH 0 idéias Respostas Fórum UV (versão de teste) 6 ideias Austrália Celebridades 0 ideias Austrália Finanças Mobile Android 0 ideias Austrália Estilo 0 idéias Austrália Yahoo Tech 0 idéias Autos Impulso 2 idéias Aviate 1,505 idéias Canadá Finanças 1,099 ideias Canadá Finanças Mobile Android 0 ideias Canadá Finanças Mobile DF iOS 3 idéias Canadá Finanças Mobile iOS 465 ideias Canadá Página inicial 5,108 idéias Canadá Filmes 14 ideias Notícias do Canadá 872 ideias Canadá com segurança 10 idéias Canadá Tela 128 idéias Canadá Clima 94 ideias Canadá Yahoo Beleza 0 idéias Canadá Yahoo Celebrity 10 ideias Canadá Yahoo Finanças 0 ideias Canadá Yahoo Filmes 10 ideias Canadá Yahoo Notícias 0 idéias Canadá Yahoo Estilo 21 ideias Futebol universitário Pick & # 39; em 112 idéias TV conectada 361 idéias Corp Mail Test 1 1.313 idéias Corp Mail Testing 1.256 idéias Cricket 19 ideias Daily Fantasy 87 ideias Developer Networ k 1 ideia Double Down 86 ideias Fantasy Baseball 431 ideias Fantasy Basketball 395 ideias Fantasy Football 704 ideias Fantasy Hockey 339 ideias Fantasy Live Scoring em Matchup e Classificações 803 ideias Fantasy Sports Aplicações Android 1.366 ideias Fantasy Sports iOS Apps 2.112 ideias Finanças 1.166 ideias Finanças - CA 493 idéias Finanças - ideias US 9 Finanças ChartIQ 417 idéias Finanças Mobile Web 403 idéias Finanças Portfolios 810 idéias Finanças Triagem de ações 35 idéias Finanças Tablet 44 idéias Flickr - Perfil 290 ideias Flickr Android 60 idéias Flickr para Apple TV 24 idéias Flickr Grupos 12 ideias Flickr Interno 0 ideias Flickr iOS Dogfooding 0 idéias Flickr iPad 126 idéias Flickr iPhone 310 ideias Flickr Nova foto Página 8,030 idéias Flickr Pesquisa 0 ideias Food Revistas 0 idéias Jogos 3,147 ideias Mapas globais 1,021 ideias GS Mobile Web 42 ideias Health Pulse 3 ideias Home Page (Android) 1.689 ideias Home Page (iOS) 3.808 ideias Hong Kong Homepage 0 ideias Índia Celebridade 43 ideias Índia Finanças 493 ideias Índia Página inicial 1.866 i deas Índia Estilo de vida 173 idéias Índia Filmes 84 idéias Índia Notícias 327 ideias Índia Parceiro Portal Tata 0 idéias Índia Parceiro Portal Tikona 0 idéias Índia com segurança 15 idéias Índia Tela 165 idéias Índia Tempo 30 ideias Índia Yahoo Beleza 0 idéias Índia Yahoo Celebridade 4 idéias Índia Yahoo Finanças 0 ideias Índia Yahoo Movies 16 ideias Índia Yahoo Notícias 0 ideias Índia Yahoo Estilo 14 idéias Indonésia Celebridade 38 idéias Indonésia Página inicial 1.151 ideias Indonésia Notícias 170 ideias Indonésia com segurança 29 ideias Indonésia Ela 34 ideias Página inicial da Irlanda 90 idéias Jordânia Maktoob Homepage 418 idéias Comentários sobre o anúncio de correio electrónico 10 ideias Maktoob الطقس مكتوب 5 ideias Maktoob Celebridade 1 ideia Maktoob Entretenimento 10 ideias Maktoob Estilo de vida 0 ideias Maktoob Filmes 2 ideias Maktoob Notícias 182 idéias Maktoob Tela 15 ideias Maktoob Id. de estilo 1 Maktoob ألعاب مكتوب 0 ideias Maktoob شاشة مكتوب 28 ideias Malásia Homepage 17 ideias Malásia Notícias 58 ideias Malásia com segurança 6 ideias Malásia Video 0 ideias Malásia Tempo 1 i dea Merchant Solutions 1 ideia My Yahoo 31,877 ideias Meu Yahoo - backup 1 idéia Meu Yahoo - US 9,176 idéias Meu Yahoo archive 314 idéias Novo Correio 9,240 ideias Novo Correio * 2,715 ideias Nova Zelândia Negócios & Finanças 132 idéias Nova Zelândia Página inicial 1.039 idéias Nova Zelândia com segurança 3 idéias Nova Zelândia Tela 0 idéias Notícias do PH ANC 21 ideias Filipinas Celebridade 214 ideias Filipinas Página inicial 8 ideias Filipinas Notícias 123 idéias Filipinas com segurança 12 idéias Filipinas Vídeo 0 idéias Filipinas Tempo 3 idéias Pick N Roll 19 ideias Postmaster 43 ideias Pro Football Pick & # 39; em 106 idéias Retail Pulse 0 idéias Rivals 11 idéias com segurança 165 idéias Tela para idéias iOS 0 Busca extensões 95 idéias Pesquisa Downloads de produtos 88 idéias Segurança 497 idéias Experiência de login 79 idéias Singapura Entretenimento 20 idéias Cingapura Finanças 230 idéias Cingapura Página inicial 1.048 idéias Cingapura Notícias 212 idéias Cingapura com segurança 11 idéias Cingapura Tela 19 idéias Cingapura Clima 4 idéias Cingapura Yahoo beleza 0 idéias Cingapura Yahoo Ideias da celebridade 4 Cingapura Yahoo Finanças 0 idéias Cingapura Yahoo Filmes 0 idéias Cingapura Yahoo Notícias 0 idéias Singapore Yahoo Style 4 ideas Idéias da celebridade da África do Sul Ideia da África do Sul 374 idéia s África do Sul Notícias 23 ideias Esportes Android 1,533 ideias Esportes CA 34 ideias Esportes iOS 1.025 ideias Esportes Redesign 3.181 idéias SportsReel 6 ideias StatTracker Beta 553 ideias Survival Futebol 81 ideias Taiwan Yahoo 名人 娛樂 0 ideias Taiwan Yahoo 運動 0 ideias Tailândia Safely 2 ideias Toolbar Mail App 216 ideas Toolbar Weather App 72 ideias Tourney Pick & # 39; em 41 ideias UK & amp; Irlanda Finanças 1.077 ideias UK & amp; Jogos da Irlanda 19 ideias UK & amp; Homepage da Irlanda 435 ideias UK & amp; Irlanda Notícias 0 ideias UK & amp; Ireland News Balde interno 0 ideias UK & amp; Irlanda Notícias Lego 375 ideas UK & amp; Irlanda com segurança 38 ideias UK & amp; Irlanda TV 21 ideias UK & amp; Irlanda Vídeo 187 ideias UK & amp; Irlanda Tempo 99 ideias Reino Unido Respostas 1 ideia UK Daily Fantasy 0 ideias UK Finanças Mobile Android 12 idéias UK Finanças Mobile DF iOS 2 idéias UK Finanças Mobile iOS 308 idéias Reino Unido Yahoo Movies 23 ideias US Respostas 8,946 ideias US Respostas Mobile Web 2,154 ideias US Autos GS 442 ideias US Celebrity GS 660 ideias EUA Comentários 350 ideias US Finance Mobile Android 40 idéias US Finance Mobile iOS 546 idéias US Flickr 237 ideias EUA 4,114 ideias EUA Homepage B1 68 ideias US Homepage B2 33 ideias US Homepage B3 50 ideias US Homepage B4 33 ideias US Homepage B5 0 ideias Página inicial dos EUA M 7,022 ideias Página inicial dos EUA YDC 43 idéias US Homes GS 203 idéias US Live Web Insights 24 idéias US Mail 193 ideias US Mail 12,212 ideias EUA Mapas 3,490 ideias US Membership Desktop 7,864 ideias US Membership Mobile 91 ideias US Filmes GS 424 ideias US Music GS 195 ideias US News 5,988 ideias US Search App Android 2 ideias US Search App iOS 9 ideias US Search Chrome Extensão 780 ideias US Search Chrome Extension v2 2,197 ideias EUA Pesquisa Desktop 4 ideias US Search Desktop Bucket A 7 ideias US Search Desktop Bucket B 8 idéias US Pesquisar KG 3 ideias US Pesquisar Locais Listados 20,757 ideias EUA Busca Mobile Web 2 ideias EUA Busca Mozilla 1 ideia EUA Pesquisar estoque Quotes 11 ideias US Pesquisar Tablet Web 0 ideias US Shine GS 1 idéia US Toolbar 5,549 ideias US Travel GS 207 idéias EUA TV GS 367 ideias US Weather 2,313 ideias US Weather Bucket 0 ideias US Weather Mobile 13 idéias US Weather Mobile Android 2 ideias Guia de vídeos Android 149 idéias Guia de vídeo iOS 205 idéias Teste de guia de vídeo 15 ideias Web Hosting 4 ideias Yahoo Acessibilidade 358 ideias Yahoo Autos 71 ideias Yahoo Beauty 100 ideias Yahoo Ideias de celebridades 0 Yahoo Celebrity Canada 0 ideias Yahoo Decor 0 ideias Yahoo Entertainment 355 ideias Yahoo Esports 50 ideias Yahoo Feedback 0 ideias Yahoo Finance Feedback Forum 1 ideia Yahoo Finanças IN Mobile Android 0 ideias Yahoo Finance SG Mobile Android 1 idéia Yahoo FinanceReel 4 ideias Yahoo Comida 118 idéias Yahoo Gemini 2 ideias Yahoo Saúde 90 ideias Yahoo ajuda 166 idéias Yahoo Início 195 ideias Yahoo Home * 28 ideias Yahoo Lifestyle 168 ideias Yahoo Yahoo 0 idéias Yahoo Mail 2,126 ideias Yahoo Mail Aplicativo Android 397 ideias Yahoo Mail Basic 628 ideias Yahoo Mail iOS App 47 idéias Yahoo Mail Mobile Web 1 ideia Yahoo Makers 51 ideias Yahoo Messenger 82 ideias Yahoo Mobile Developer Suite 60 idéias Yahoo Mobile para ideias do telefone 15 Yahoo Mobile para idéias do Tablet 0 Yahoo Music 76 idéias Yahoo News Digest Android 870 idéias Yahoo News Digest iPad 0 idéias Yahoo News Digest iPhone 1,531 idéias Yahoo Newsroom Aplicativo para Android 55 idéias Yahoo Newsroom iOS App 30 ideias Yahoo Parenting 63 ideias Yahoo Politics 118 idéias Yahoo Publishing 13 ideias Yahoo Real Estate 2 ideias Yahoo Tech 459 ideias Yahoo Travel 143 idéias Yahoo TV 102 ideias Yahoo View 204 ideias Yahoo Weather Android 2.138 ideias Yahoo Weather iOS 22.677 ideias Yahoo! 7 Food App (iOS) 0 ideias Yahoo! 7 Página inicial Archive 57 ideas Yahoo! 7 Notícias (iOS) 23 ideias Yahoo! 7 Tela 0 ideias Yahoo! 7 TV FANGO App (Android) 1 ideia Yahoo! 7 aplicação TV FANGO (iOS) 1 ideia Yahoo! 7 TV Guide App (Android) 0 ideias Yahoo! 7 TV Guide App (iOS) 1,245 ideias Yahoo! 7 Aplicação TV Plus7 (iOS) 0 ideias Yahoo! Centro de Feedback do Teste de Conceito 174 idéias Yahoo! Idéia de Contributor Network 1 Yahoo! Transliteração 29 ideias YAHOO! 7 Finanças 551 idéias Yahoo! 7 Jogos 9 ideias Yahoo! 7 Safely 19 ideias Yahoo7 Finanças Mobile DF iOS 12 ideias Yahoo7 Finanças Mobile iOS 217 ideias Yahoo7 Homepage 2.544 ideias.
Sua senha foi alterada.
Fizemos alterações para aumentar nossa segurança e restabelecer sua senha.
Acabamos de enviar-lhe um e-mail para. Clique no link para criar uma senha, depois volte aqui e faça o login.
Deterministic Machine Design of Trading Systems With Strict Validation.
A high win rate trading system for SPY was machined designed using a deterministic method and a simple predictor of price. Validation of in-sample results was performed on out-of-samples of SPY and of an anti-correlated security.
The results show that high win rate trading systems with appropriate risk:reward ratio can be machined designed that are even profitable on an anti-correlated market.
Deterministic machine design of trading systems is a process that produces the same result each time it mines the same data with the same design parameters. This is a process compatible with the requirements of scientific testing and analysis. Note that most machine design algos based on neural networks or genetic algorithms do not in general produce the same result when fed with same data and same parameters due to randomness in initial conditions.
Validation is the process of assessing how the results of machine design perform on an independent data set for the purpose of guarding against Type III errors , i. e., the testing of hypotheses suggested by the data. However, in the case of machine design it is known that simple validation is not sufficient due to multiple hypotheses testing and data-snooping. More advanced procedures of validation are required to assess the significance of trading systems developed via machine design. In this blog, in addition to the out-of-sample test, another strict test is performed on an anti-correlated security during the same unseen data period.
Data set and in-sample performance parameters.
We will use Price Action Lab to machine design a trading system for SPY that will be comprised of a number of short-term price patterns. The close of daily bars will be used as the predictor of price with a maximum look-back period of 9 bars. The available data sample from inception of this ETF is split as follows:
The minimum required win rate for each of the patterns is 85%. The profit target is set to 2% because we would like to avoid as much as possible fitting exits to the data. The stop-loss is set to 4% based on the requirement for a minimum profit factor of 1.5 per pattern identified in the in-sample. We also require that each pattern in the in-sample has more than 20 trades and no more than 7 consecutive losers. Below is the workspace for the in-sample machine design:
Each line on the results corresponds to a price pattern that satisfies the performance parameters specified by the user. Trade on is the entry point, in this case the Open of next bar. P is the success rate of the pattern, PF is the profit factor, Trades is the number of historical trades, CL is the maximum number of consecutive losers, Type is LONG for long patterns and SHORT for short patterns, Target is the profit target, Stop is the stop-loss and C indicates % or points for the exits, in this case it is %. Last Date and First Date are the last and first date in the historical data file.
Price Action Lab identified 30 distinct patterns that satisfied the criteria specified on the workspace, 23 long and 7 short. Since good performance is guaranteed in the in-sample by design, we will continue with out-of-sample testing. We will just mention that in the in-sample the compound annual return was 22% and Sharpe ratio was 2.57.
Next, Amibroker code was generated for the price patterns and they were combined with the OR operator into a final trading systems.
The backtest results in the out-of-sample are shown below:
The equity curve is acceptable although below buy and hold (non-adjusted data). However, we should not expect a single system to outperform buy and hold, especially when there is a strong trend during the last two years. The compound annual return is 9.84%, the net return is 79.76%, max. drawdown is -14.92%, profit factor is 1.47 and Sharpe ratio is 1. A total of 150 trades were generated in the out-of-sample, 109 long and 41 short. Short trades contributed about 4.8% to the compound annual return. Note that commission of $0.01 per share was included in the testing and the initial capital was $100K. Equity was fully invested at each new position.
The acceptable results in the out-of-sample does not suffice for the purpose of guarding against Type-III errors. This is true because the machine design process tested many systems in the in-sample before offering a final result. Additional tests are required. Since k-fold cross-validation and other data partitioning methods are difficult to apply in the case of trading systems, we will resort to randomization tests and tests on comparable but anti-correlated securities.
Below is the distribution of net returns of 20,000 random long/short SPY trading systems that initiate positions at the close of daily bar in the out-of-sample based on the outcome of a fair coin toss (heads = long, tails = short). Long positions are closed when tails come up and short positions are closed when heads show up. Starting equity is $100K, commission is set at $0.01 per share and equity is fully invested at each position:
The net return of 79.76% in the out-of-sample of the machine designed system for SPY scores higher than 96.09% of the random systems, resulting in a p-value of 0.0391. Therefore, given that the null hypothesis is true, the probability of obtaining the tested return in the out-of-sample by chance is about 4%. Mas é mesmo? The answer is that maybe it is not and it is actually higher. We need additional validation.
A strict cross-validation test.
Since our system was developed by essentially performing multiple tests, the above randomization analysis is a first step in ruling out Type-III errors but it does not suffice. We can use such this analysis to save time in the sense that if the p-value is higher than 0.05 we can then reject the system. But a high p-value does not rule out a spurious system due to multiple testing, i. e., a system that was lucky enough to pass the randomization test.
For the purpose of increasing the chances that our result is not spurious, we will identify an anti-correlated security in the out-of-sample period and test the system. A good candidate for this test is TLT, as shown below:
The average 120-day correlation of SPY and TLT during the out-of-sample period was -0.34 with a period of nearly two years, which is marked on the chart, of high anti-correlation. Below is the equity performance of the system developed for SPY on TLT data in the same out-of-sample period:
In the case of TLT the system outperforms buy and hold with compound annual return of 9.43% and net return of 75.60%. Max. drawdown is -11.14% and Sharpe is 1.06 with profit factor equal to 1.49.
This is a significant result. A system developed for SPY works even better on TLT, an anti-correlated security. Thus, the probability that the patterns identified during machine design have predictive power is high. However, note that this test must be performed only once. If the results are not satisfactory, searching for another anti-correlated security that will provide a positive result, or for another system that will provide a positive result with the same test, introduces data-snooping bias and invalidates the significance of these tests. The same applies to any process that reuses data to perform tests in an out-of-sample . If the data is reused many times, data-fishing is guaranteed along with spurious results. Apparently, this is what plagues the efforts of many system developers that use neural networks and genetic algorithms to mine for edges. This is also why determinism is important: If a different system is mined at every new trial, or there are many different systems with good performance, this facilitates data-snooping. However, with Price Action Lab this is not possible because with the same parameters, the same system will be found and all patterns are used to develop the final system, i. e., there is no selection bias.
Below is the distribution of net returns of 20,000 random long/short TLT trading systems that initiate positions at the close of each daily bar in the out-of-sample based on the outcome of a fair coin toss (heads = long, tails = short). Starting equity is $100K, commission is set at $0.01 per share and equity is fully invested at each position:
The net return of 75.60% of the machine designed system for TLT scores higher than 97.47% of the random systems, resulting in a p-value of 0.0253. Therefore, given that the null hypothesis is true, the probability of obtaining the system results in the out-of-sample by chance is about 2.5%.
Simple predictors of price action, such as the close of daily bars, still possess predictive power despite a continuous arbitrage of opportunities in the markets. This was demonstrated in this blog. It is important that the machine design that uses a simple predictor to develop an algo is deterministic; otherwise complex tests must be used to guard against Type-III errors and data-fishing. The complexity of the required tests render the application of machine design based on random initial conditions extremely difficult in the case of trading system development. Due to the deterministic nature of the machine design algorithm used in this example, a simpler but strict test was used based on the performance of the system on an anti-correlated security. However, any abuse of these types of tests renders them ineffective in guarding against Type-III errors. Obviously, trading system development is not easy and it is getting harder as technology progresses. Traders have two options when developing systems: The first option is based on conceiving a hypothesis to test that must be unique, otherwise it may be an artifact of data-mining bias. The second option involves using machine design. Both options have pitfalls. The first option requires uniqueness and the second option requires effective cross-validation tests. It may be the case that coming up with a unique hypothesis has low chances due to relentless data-mining in the last 25 years using computers and backtesting.
Você pode assinar aqui notificações de novas postagens por e-mail.
Programa de gráficos: Amibroker.
© 2015 Michael Harris. Todos os direitos reservados. Nós concedemos uma permissão revogável para criar um hiperlink para este blog sujeito a certos termos e condições. Qualquer cópia, reprodução, distribuição, publicação, exibição, modificação ou transmissão não autorizada de qualquer parte deste blog é estritamente proibida sem autorização prévia por escrito.
Assine a nossa lista de e-mails e obtenha atualizações para sua caixa de entrada de e-mail.
Obrigado por se inscrever.
Algo deu errado.
Nós respeitamos sua privacidade.
Categorias.
Aviso de direitos autorais.
© 2011 & # 8211; 2018 Michael Harris. Todos os direitos reservados. Nós concedemos uma permissão revogável para criar um hiperlink para este blog sujeito a certos Termos e Condições. Qualquer cópia, reprodução, distribuição, publicação, exibição, modificação ou transmissão não autorizada de qualquer parte deste blog é estritamente proibida sem autorização prévia por escrito.
Комментариев нет:
Отправить комментарий