Tuesday, 24 April 2018

Queuing theory forex trading


Queuing Theory O que é a Teoria da fila Um método matemático de análise das congesções e atrasos de espera na fila. A teoria da fila examina todos os componentes da espera em linha para serem atendidos, incluindo o processo de chegada, o processo de serviço, o número de servidores, o número de lugares do sistema e o número de clientes (que podem ser pessoas, pacotes de dados, carros, etc.). As aplicações da vida real da teoria da fila incluem o fornecimento de um serviço ao cliente mais rápido. Melhorando o fluxo de tráfego, enviando pedidos de forma eficiente a partir de um armazém e projetando sistemas de telecomunicações, como call centers. BREAKING DOWN Teoria da fila A teoria da fila é usada para desenvolver sistemas de enfileiramento mais eficientes que reduzam os tempos de espera dos clientes e aumentam o número de clientes que podem ser atendidos. Por exemplo, um artigo de 2003 da Stanford School of Business, professor Lawrence Wein, usou a teoria da fila para analisar os efeitos potenciais de um ataque de bioterrorismo em solo dos EUA e propor um sistema para reduzir os tempos de espera para medicamentos que diminuam o número de mortes causadas por tal Ataque. Queueing Theory Cálculos e Exemplos Eu escrevi anteriormente na Teoria da fila e intitulou essas postagens como Teoria da fila: Parte 1 e Teoria da fila: Parte 2. Você também pode ver todos os 40 artigos sobre a Teoria da fila. Hoje, a Irsquoll explica brevemente como configurar um modelo no Microsoft Excel para simular uma fila de servidor único. Estes cálculos de teoria de filas podem ser usados ​​em várias configurações. Totalmente para você. A teoria da fila mostra a interação entre a taxa de chegada e a taxa do serviço, que revelam as características da fila e, finalmente, a experiência do cliente. Os itens entre parênteses abaixo são os números de células na minha imagem de exemplo (veja abaixo). Taxa de chegada. Configure um campo para aceitar os clientes por hora (B5) Seguido por um campo para aceitar os minutos médios entre as chegadas (60B5). Taxa de serviço. Em seguida, precisamos configurar a taxa de serviço. Para fazer isso, crie um campo que aceite clientes por hora (B7). Isto é seguido por um campo para aceitar o Tempo Médio de Serviço em Minutos (60B7). Agora, podemos aprender sobre as características da fila e também como o cliente pode experimentar a fila: Utilização média do servidor. Crie um campo para calcular a Utilização média do servidor (B5B7). Número médio de clientes na linha. Configure um campo para calcular o número médio de clientes na linha (B52 (B7 (B7-B5))). Número médio de clientes no sistema. Agora, crie um campo para calcular o número médio de clientes no sistema (B5 (B7-B5)). Tempo médio de espera na linha. Agora, podemos determinar quanto tempo é, em média, para um cliente aguardar na linha em horas (B5 (B7 (B7-B5)) e em minutos ((B5 (B7 (B7-B5))) 60) Tempo médio no sistema. O sistema aqui é definido o tempo acumulado de (Esperando na linha que está sendo servida). Por horas. Crie um campo que calculará o seguinte (1 (B7-B5)) e para Minutos ((1 (B) B7-B5) 60). Thatrsquos it. Com alguns cálculos simples, podemos determinar a carga de um sistema quanto tempo é, em média, um cliente aguardar o serviço. Teoria da fila é muito pragmática, aplicável e bastante fácil Para fazer. Therersquos muita mística de quant-jock em torno disso, mas itrsquos realmente não é difícil de entender e pode realmente afetar o comportamento das empresas. Onde você pode aplicar isso? Qualquer processo de negócios onde as linhas são uma questão de fato, isso significa: Escritórios de Emergência ou de Doutorado Restaurantes Servidor Carga em um ambiente de rede Cumprimento Centro de Distribuição ou Armazenamento Gerenciamento de Projetos Call Centers S Oftware Engineering etchellip Teoria da fila não é suficiente, na minha experiência. Mais empresas poderiam se beneficiar de seu uso e aplicação. No final do dia, simplesmente aprender sobre quanto tempo um cliente pode esperar na fila ajudará um negócio a melhor projetar seu serviço para fornecer mais valor agregado à experiência do cliente. James Nutting diz que estou tentando descobrir se existe uma maneira razoavelmente simples de prever a probabilidade de um tempo de espera de fila exceder um determinado comprimento para um sistema de filas multi-servidor com uma taxa de chegada de poisson e uma taxa de serviço constante. Por exemplo, para um centro de atendimento com uma taxa de chegada de chamada de 50 horas e um tempo de serviço de 5 minutos, como posso calcular quantos servidores eu preciso para que 80 de chamadas tenham um tempo de espera de gt 20 segundos. Eu ficaria muito grato se pudesse me informar se esse cálculo é possível e, em caso afirmativo, qual é a equação. Muito obrigado eu percebo que a probabilidade (de tempo) está faltando nas suas instruções de excel, você pode incluí-lo. Marcela Linares diz que esse modelo funciona apenas para um único servidor Eu estou tentando calcular o número médio de peças em cada uma das estações de trabalho Em uma oficina de pintura. Você acha que posso usar essa abordagem. Estou tentando aplicar seus cálculos de planilha para uma linha de filas para acessar um estacionamento de escola secundária. Na verdade, eu gostaria de criar dois cenários, como uma demonstração do que parece ser um pensamento defeituoso. Aproximadamente 380 veículos de entrega de pilotos com amplificador de estudantes chegam dentro de um período de 25 minutos para acessar o estacionamento na escola. (Aproximadamente 15 dos veículos são controlados pelos pais). O In-Queue é uma estrada de condado de 1 milha que vai de um semáforo para a escola. Antes disso, os alunos chegam de qualquer uma das três direções a uma taxa variável. O semáforo lança uma dimensão para isso que realmente não precisamos considerar porque a fila é consistentemente sólida durante toda a milha por pelo menos 15 dos 25 minutos. Basta dizer que todos os dias (M-F), uma linha se forma da luz para o parabéns da entrada da escola para o páramo. A estrada do condado morto tem tráfego de passageiros ligeiros, principalmente para o lighthellip, talvez 30-35 veículos (incluindo chegadas na escola) dentro desse mesmo período de 25 minutos. Os ônibus têm outra entrada. Os alunos desenvolveram uma maneira ldquobrilliantrdquo de contornar a interferência do tráfego externo, sem considerar o quanto eles estão abrandando o tráfego ao fazê-lo. Periodicamente, um aluno passará pela entrada da escola (há uma pista dupla para facilitar o tráfego). Esses alunos, então, fazem um u-turn na próxima entrada da comunidade disponível. Cada aluno que faz isso, então, ajuda a criar uma situação de parada de 4 vias (fazendo com que uma fila seja formada para o tráfego), permitindo que a alternância no tráfego faça a mudança para a escola. Ao fazê-lo, provavelmente estão duplicando o tempo de espera para esses alunos na fila de tráfego. A melhor forma de mostrar a diferença entre este método e permitir que o tráfego externo funcione a 30 mph sem paradas para que eles não estejam no caminho dos estudantes que esperam se virar. Evidentemente, esses alunos se aproximam da mudança para a escola quando não há Os veículos de saída não teriam que chegar a uma parada completa. Gostaria de demonstrar para uma aula de matemática quanto tempo é adicionado a cada tempo de espera de alunos por sua abordagem de parada de 4 vias ldquobrilliantrdquo. Apenas a hesitação sozinha, enquanto todos garantem que o veículo fora-ligado vai permitir que o veículo interno se aponte pode ser 3-5 segundos, e não deve mencionar que todos têm que parar completamente neste ponto. Eu percebo que a probabilidade (do tempo) está faltando nas suas instruções do Excel, você pode incluí-lo. A Curva do Sino Mágico da Distribuição Padrão Juntou-se a outubro de 2005 Status: Membro 59 Posts Prezado 4X Amigos seguintes: A exibição científica mais valiosa que já vi na minha A vida foi na Feira Mundial de Nova York de 1964 em Flushing Meadows, Queens, NY, onde Shea Stadium, onde os Mets jogam agora e também onde os campeonatos de tênis são jogados no (relativamente) novo Complexo de Tênis Arthur Ashe. Eu assombrou essa feira. Eu estava lá quase todos os dias e de todas as coisas fantásticas que havia para ver lá, a exposição que mais me agarrou foi a demonstração Bell Curve of Standard Distribution. Ao lado de Foucaults Pendulum, que prova a rotação da Terra, essa foi a exibição científica mais útil, educacional, dramática e sensacional que já vi. Imagine um retângulo com cerca de 30 pés de comprimento e cerca de 20 pés de altura com paredes de vidro em ambos os lados. Dentro do retângulo estava uma série de tiras verticais de metal que criou cerca de 100 divisões executando o comprimento do retângulo. Todas as três horas, esta máquina despejaria cerca de 100.000 rolamentos de esferas de aço no retângulo no topo e estes iria saltar por todo o lugar até que finalmente se instalassem em uma ou outra dessas divisões de metal que eram apenas um pouco maiores do que o diâmetro do Rolamentos de esferas, então demorou muito para dar uma volta antes que eles finalmente pudessem se instalar em um. No interior das paredes de vidro em ambos os lados foi pintada a Curva Bell da Distribuição Padrão. Levaria cerca de três horas para o último dos rolamentos de esferas saltando para se instalar na divisão escolhida e quando a demonstração foi concluída, os rolamentos de esferas caíram nas 100 divisões exatamente na forma da Curva Bell da Distribuição Padrão e combinadas com O milímetro que a Curva pintou em ambos os lados do vidro 8 vezes ao dia, essa manifestação continuou, 24 horas por dia, todos os dias a feira estava aberta e nunca mais os rolamentos de esferas não caíram nas divisões na forma exata do Bell Curve. Nenhuma vez. Nunca mais perdi um milímetro. Pense nisso. O que significa é simplesmente isso: você nunca poderia prever a divisão em que qualquer rolagem de bola particular caísse. Isso foi aleatório no extremo. As probabilidades contra tal previsão foram 100-1 por rolamento de esferas. Mas o resultado final da ação combinada de 100.000 rolamentos de esferas foi tão previsível quanto o nascer do sol, o pôr do sol, os eclipses e as marés. Fale sobre quotOld Faithfulquot Então, é com nossa negociação. Se tivermos um bom método que produza uma porcentagem digna de vitoria a bons preços, então, ao longo de uma série de repetições estatisticamente significativa, essa porcentagem vencedora irá afirmar-se, embora qualquer comércio particular ou mesmo série de negócios possam sofrer um resultado aleatório e imprevisível. O que nos derrota é uma aplicação ao acaso: tendemos a saltar de um método para outro de forma promiscua, como Scarlett OHara flertando com sua turma de pretendentes admiradores na bola. Assim que um método atinge um período ruim, nós o abandonamos e passamos para outro Método a tempo de perder o próximo lote de vencedores no primeiro método e pegar o próximo lote de perdedores no próximo método. Então retornamos ao primeiro método, a tempo de pegar o próximo lote de perdedores e perca o próximo lote de vencedores no segundo. Já aconteceu com você. É claro. E nós nos perguntamos por que não podemos ganhar. É por isso que os comerciantes tendem Para enfatizar o comércio sistemático. Qualquer sistema, eles dizem, é melhor do que nenhum sistema. E é verdade. Todos e cada um de nós tem tudo o que precisamos para vencer esse mercado por grandes dólares. Mas não podemos fazê-lo sem aplicar os sinais à nossa negociação de forma sistemática. Tenha um ótimo fim de semana e lembre-se de que voltaram a trabalhar, domingo a noite, hora do leste, com o nosso excelente mercado de 24 horas por dia. Nós temos um número imenso de vantagens comerciais únicas neste mercado, então eu vou sair e ganhar. É tão fácil como perder, você sabe, e muito mais divertido. E se alguém lhe disser que não pode fazê-lo, despeje-os e ache Algumas outras pessoas que irão apoiar seus esforços e incentivá-lo. Evite pessoas negativas como a praga Eles não têm nada a oferecer para você. Eles são puro veneno. Yr Fellow 4X Trader, o grande sucesso é um concurso difícil de entender que você não precisa saber o que vai acontecer a seguir, a fim de ganhar dinheiro (como eu vi você publicar em outro tópico). O conhecimento das estatísticas é essencial para os comerciantes do sistema. A compreensão dos desvios padrão e das distribuições do winloss mantém você fora do problema. No nível mais básico, o conhecimento impedirá que você seja surpreendido por uma série de vitórias, e irá mantê-lo impaciente diante de uma série de perdedores. Em um nível mais avançado, irá ajudá-lo a desenvolver sistemas que realmente tenham uma vantagem. Obrigado, Merlin. Excelentes comentários. Mas obtenha isso: embora eu tenha feito bem no meu curso de Estatística na faculdade e conheci essas coisas durante anos intelectualmente, nunca usei esses entendimentos no meu comércio até que o livro Mark Douglass me acordei Go figure. O destino do comércio atual e seu impacto na minha conta de negociação hipnotizou-me totalmente, como eu acho 99 e 99100 de comerciantes amadores. Mas isso é tudo errado, errado, errado, errado Assim como você diz, para negociar com sucesso, NÃO DEVE permitir-se ser quotwowed por uma série de vitórias. Ou deprimido diante de uma série de perdedores. Você vai se matar dessa maneira. Enquanto você está extasiado com seus vencedores, você fica imprudente, você faz negócios estúpidos e arriscados, porque você se diz que você só está brincando com quotouse moneyquot mesmo assim (o que é ridículo Concepção para começar porque, uma vez que você ganhou, esse dinheiro é SUO e quando você o perder novamente, você está perdendo o seu dinheiro, e não o quotHousesquot) e quando a série de perdedores vem, você começa a duvidar de sua auto-estima, você encaixa a todos , Você não pode dormir e você chuta o gato SEU COMPORTAMENTO RIDÍCULO E perigoso, também O livro de notas me levantou pelo pêlo do pescoço, assim como você levanta uma gatinha recalcitrante e tirou meu nariz sujo da minha obsessão com o presente comércio E, desde então, é como um mundo totalmente novo para mim. Os perdedores são perdedores, isso é tudo, não calamidades tremendas. Quero dormir como um bebê. Eu chamo meu tiro, eu me protejo o mais longe possível com minhas paradas e então eu deixo as coisas seguirem o seu curso porque estou trabalhando com algumas boas metodologias e eu ganho mais do que eu perco no longo prazo, mas eu não estou agonizando durante a Processar tanto quanto eu fiz no passado. Eu fiz o quotDouglas Challengequot - Troquei minha metodologia (ou quotedgequot) em mais de 20 negociações consecutivas ANTES de julgar meus resultados. E o que você conhece Ive obteve um recorde de vitoria E 20 trades é realmente um pequeno tamanho de amostra (veja o Capítulo 11 do quotTrading no Zonequot) O material psicológico no livro de Marks é para explicar-nos porque sabemos coisas assim intelectualmente MAS NUNCA APLICAMOS ELAS Ele passou por mim LOUD E CLARO e eu elogio sobre seu livro para os outros por esse motivo. Obrigado pelo excelente comentário, eu acho que o Sr. Whipple faz uma excelente sugestão. As paradas podem ser definidas com base na volatilidade para incluir uma grande parcela do movimento de preços no momento. Isso parece ser uma aplicação prática. Eu entendo que o movimento das bandas de Bollinger pode ser visto como uma medida de volatilidade, ou, suponho em termos estatísticos, o desvio padrão da amplitude de movimento. Achei isso no Wickepia. O logaritmo das taxas de juros, taxas de câmbio e inflação dessas variáveis ​​se comportam como interesse composto, não como um interesse simples, e também os índices de mercado de ações multiplicativos devem ser multiplicativos também, mas alguns pesquisadores afirmam que eles são variáveis ​​distribuídas por Levy em vez disso De lognormal Outras variáveis ​​financeiras podem ser normalmente distribuídas, mas não há motivo para esperar que a priori. Isso sugere algum debate sobre o que constitui hipóteses estatísticas apropriadas sobre o movimento de preços. Ainda estou à espera de alguém falar sobre a teoria do caos e fractals. O fato de que os mercados são melhor descritos pelas distribuições da lei do poder (variância infinita). É por isso que as estratégias de negociação, como a utilizada por Richard Dennis Quotturtlesquot, conseguiram. Eles aproveitaram a variância infinita e os outliers perseguidos. Esse conceito é provavelmente o modo como o velho índice de adotação de seus lucros corre e reduz as perdas resultantes (embora tal adágio seja inútil sem entender por que ele pode funcionar, para poder aplicá-lo adequadamente). Nassim Taleb, o autor de quotfooled by randomnessquot, também usa essa idéia em seu hedge fund através de uma estratégia de opções que absorve lucros enormes durante os principais shockscrises nos mercados financeiros. Ele não tem idéia do que esses eventos serão, ou quando eles ocorrerão, mas apenas é altamente provável que esses eventos extremos ocorram dentro de um prazo razoável. O dinheiro que ele não colocou em seu fundo de hedge que ele coloca nas ações do Tesouro dos EUA é muito arriscado. Ele diz respeito à teoria do caos e aos fracturas. Eu acredito que os mercados são de natureza fractal porque exibem auto-semelhança em escalas (por exemplo, diariamente E os gráficos semanais mostram propriedades estatísticas similares). Combinado com a idéia geral da teoria do caos (em oposição às suas aplicações específicas na dinâmica de fluidos), você pode modelar o comportamento geral dos mercados e talvez fazer observações, como ver que a volatilidade geralmente ocorre em clusters. É engraçado, eu acho que seguir o mercado é como seguir um animal selvagem. Embora um animal selvagem possa ser imensamente imprevisível, exibe alguns comportamentos característicos. Cada mercado é como uma besta selvagem diferente e, como a maioria das bestas selvagens, quanto mais perto você chegar (o mercado), quanto mais imprevisível parecerá, e o mais provável é que você coma você para o almoço. Estatísticas bayesianas para estatísticas bayesianas. Um grande negócio no momento. Foi apresentada como uma solução para uma série de problemas importantes, entre outras disciplinas, leis e remédios. Esses problemas estão preocupados com questões como determinar a probabilidade de um suspeito específico ter cometido um assassinato se suas impressões digitais forem encontradas na arma, ou a probabilidade de uma pessoa que testar positivo para o HIV realmente tem uma infecção pelo HIV. Esses são, claramente, assuntos importantes. No entanto, a maioria das pessoas não consegue ver que existem dificuldades aqui. Se a probabilidade de duas pessoas terem as mesmas impressões digitais é, digamos, uma em 500.000, e as impressões digitais correspondentes à pessoa X são encontradas na arma do crime, então certamente é uma certeza quase certa de que X é o assassino E se eu lhe disser que 99.5 De pessoas com um teste de infecção de HIV confirmado positivo para o HIV, então certamente uma pessoa que teste positivo é 99.5 provável que tenha o vírus. Na verdade, ambas as conclusões são erradas. Morto errado, se você perdoar a expressão. A importância do teorema de Bayes é que ele irá dizer-lhe a verdadeira probabilidade de uma pessoa ter uma infecção pelo HIV se ele testar positivo, e a verdadeira probabilidade de a pessoa X ser o assassino se suas impressões digitais aparecerem na arma. Ou, pelo menos, fará isso se você puder alimentar os dados certos, o que nem sempre é fácil. Em um célebre processo judicial (R v Adams 1998 1 Cr App R 377, para qualquer advogado que esteja interessado) Lord Bingham, um dos juízes mais altos do Reino Unido, recusou-se a permitir que a defesa apresentasse um argumento ao júri com base no teorema de Bayes . Ele admitiu que era uma abordagem metodologicamente sólida, mas que confundiria o júri. Na verdade, o teorema de Bayes é extremamente direto e não precisa confundir quem possa adicionar, multiplicar e dividir. O resultado desta decisão dos juízes poderia ter sido que uma pessoa inocente foi condenada, porque uma probabilidade baseada em um cálculo bayesiano não é meramente melhor do que o resultado intuitivo, é a única resposta correta. Qualquer resposta diferente é simplesmente errada. Não é errado no sentido de roubar é errado, mas errado no sentido de que 225 está errado. Neste artigo, vou explicar como funciona o teorema de Bayes, desde os primeiros princípios. Suponho que o leitor não tenha conhecimento de matemática além da aritmética elementar. No final do artigo, vou tentar mostrar como o teorema de Bayes pode ser derivado do exemplo de senso comum que eu apresento, e seguir isso requer um conhecimento da álgebra básica. Mas você não precisa ser capaz de seguir a derivação para apreciar o funcionamento do método Bayes. Começarei por considerar, como o próprio Reverendo Sr. Bayes, a melhor maneira de apostar em uma corrida de cavalos. Como apostar no gee-gees Vamos assumir que existe uma corrida entre dois cavalos: Fleetfoot e Dogmeat, e eu quero determinar qual cavalo apostar minha camisa. Acontece que Fleetfoot e Dogmeat correram um contra o outro em doze ocasiões anteriores, todas as corridas de dois cavalos. Destas últimas doze corridas, Dogmeat ganhou cinco e Fleetfoot ganhou os outros sete. Portanto, todas as outras coisas sendo iguais (o que não é mostrado abaixo), a probabilidade de a Carne de cachorro ganhar a próxima corrida pode ser estimada a partir de suas vitórias anteriores: 5 12, ou 0.417, ou 41.7, no entanto você prefere expressá-la. Fleetfoot, por outro lado, parece ser uma aposta melhor em 58.3. Então, dado apenas a informação que temos, e tudo o mais sendo igual (incluindo as chances oferecidas pelas casas de apostas sobre esses dois cavalos), você quer voltar a andar de frente. Uma probabilidade de ganhar 58.3 é mais favorável do que uma probabilidade 41.7. Agora vamos adicionar um novo fator no cálculo. Acontece que em três das cinco vitórias do Dogmeats anteriores, chovia fortemente antes da corrida. No entanto, choveu apenas uma vez em qualquer um dos dias que ele perdeu. Parece, portanto, que Dogmeat é um cavalo que gosta de ir suave, como dizem as casas de apostas. No dia da corrida em questão, está chovendo. Agora, como essa informação extra afeta onde você deve colocar seu dinheiro Se você ignorar as informações sobre o clima e usar apenas as contagens de vitórias e perdas anteriores, você deve, claro, voltar ao Fleetfoot conforme determinamos anteriormente. Por outro lado, se você usar apenas as novas informações sobre o clima e negligenciar as contagens anteriores de ganhos e perdas, talvez você de volta a Dogmeat. Isso ocorre porque três das suas cinco vitórias anteriores foram nos dias chuvosos. Você pode estimar sua probabilidade de ganhar como 3 5, ou 60, nessa base. No entanto, fazer isso seria ignorar uma peça crucial de informações que o Dogmeat geral ganhou menos corridas do que Fleetfoot. O que precisamos fazer é combinar as duas informações para obter algum tipo de probabilidade geral de Dogmeat ganhando a corrida. Para fazer isso, precisamos examinar quatro situações possíveis: a Carne de cachorro ganha quando chove A Carne de cachorro ganha quando não chove A carne de cachorro perde quando chove A carne de cachorro perde quando não chove. Sabemos que a Dogmeat conseguiu três de suas cinco vitórias nos dias chuvosos, e apenas chovia uma vez que perdeu. Isso significa que ele deve ter ganho duas vezes em um dia ensolarado. Uma vez que houve doze corridas, o número de vezes que ele perdeu em um dia ensolarado deve ser 12 - (3 1 2), que é 6. Podemos tabular esses resultados como este: O que precisamos saber é a probabilidade de ganhar o Dogmeat, Dado que está chovendo (porque agora está a chover). Claro, podemos descobrir a probabilidade de ganhar Fleetfoot em vez disso, mas desde que (assumimos) um cavalo deve vencer, sempre podemos calcular uma probabilidade de cavalos subtraindo os outros de 1.0. Note-se que a probabilidade de ganhar o Dogmeat dado que está chovendo não é o mesmo que a probabilidade de chover quando a Dogmeat ganhar. Já calculamos essa probabilidade como 60 (três dias chuvosos em cinco vitórias). Então, qual é a probabilidade de ganhar o Dogmeat, já que está chovendo? Como qualquer outra probabilidade, calculamos isso dividindo o número de vezes que algo aconteceu, pelo número de vezes que poderia ter acontecido. Sabemos que Dogmeat ganhou em três ocasiões em que choveu, e houve quatro dias chuvosos no total. Então, a probabilidade de Dogmeats de ganhar, dado que agora está a chover, é de 3 4, ou 0,75 ou 75, no entanto, você gosta de escrevê-lo. Observe que a informação adicional que Dogmeat ganhou três vezes em quatro em um dia de chuva, mdash muda sua probabilidade de ganhar esta corrida atual de 41.7 para 75. Mais importante ainda, isso significa que agora Dogmeat é mais provável de ganhar do que Fleetfoot, mesmo Embora Fleetfoot ganhou mais corridas em geral. Esta é uma informação importante se você planeja apostar sua camisa mdash se estiver chovendo, você deve devolver a Carne de cachorro se não for, você deve voltar ao Fleetfoot. O teorema de Bayes, teorema de Bayes, não é mais do que uma generalização em álgebra do procedimento que descrevi acima. É uma maneira de descobrir a probabilidade de algo em face de uma determinada peça ou peça de evidência. O teorema geralmente é escrito assim: p (AB) p (BA) p (A) p (B) p (AB) (geralmente a probabilidade de leitura de A dada B) é a probabilidade de encontrar a observação A, dado que algum pedaço de A evidência B está presente. No exemplo acima, A foi o resultado em que ganhou a Dogmeat e B é a evidência de que está chovendo. P (AB) é o que queremos descobrir. P (BA) é a probabilidade de a evidência aparecer, dado que o resultado obtém. Em outras palavras, esta é a probabilidade de chover, dado que a Dogmeat ganha. Uma vez que estava chovendo três das cinco vezes que a Dogmeat ganhou, p (BA) é 3 5, ou 0,6. P (A) é a probabilidade de ocorrência do resultado, sem conhecimento das novas evidências. No nosso exemplo, p (A) é 5 12, ou 0.417, porque a Dogmeat ganhou cinco em doze ocasiões. Finalmente, p (B) é a probabilidade de a evidência surgir, sem considerar o resultado. No nosso exemplo, é a probabilidade de chuva, sem consideração pelo qual o cavalo ganhou a corrida. Como sabemos que choveu quatro dias, esse valor é 4 12 ou 0.333. Então, o valor de p (AB) mdash a probabilidade de ganhar Dogmeat dado que está chovendo mdash é que você verá que esta é exatamente a mesma resposta a que chegamos, tabulando as contagens de vitórias e perdas em chover e bons dias antes. Em suma, o teorema de Bayes é uma maneira de realizar o mesmo cálculo, mas começando com probabilidades e não contagens. Isso pode ser importante porque muitas vezes não conhecemos as contagens exatas envolvidas, apenas as probabilidades. Mas o método Bayes não nos diz nada que não possamos funcionar simplesmente contando e dividindo. Outro exemplo Aqui está outro exemplo do teorema de Bayes no trabalho. Considere um sistema que teste se os componentes do computador estão funcionando ou estão com defeito, com base na temperatura que eles executam quando estão funcionando. Suponha, por exemplo, que 99,5 dos componentes que estão com defeito correm em mais de 50 graus. Agora, se tomarmos um componente específico e testá-lo, e a temperatura é de 53 graus, é provável que seja um componente defeituoso. Se você pode responder a essa pergunta com um número mdash, particularmente se esse número for 99.5 mdash, você precisa ler o Primeira parte deste artigo novamente, porque sua resposta será errada. A resposta correta é que eu não sei. Eu simplesmente não lhe dei todas as informações que você precisa para responder a pergunta. O que você precisa saber é a probabilidade de os componentes serem defeituosos, dado que é muito quente. Podemos escrever isso como p (faultyhot). Mas o que lhe disse foi a probabilidade de um componente defeituoso executando hot mdash p (hotfaulty). Estas duas figuras são relacionadas pelo teorema de Bayes: p (defeituoso) é a probabilidade geral de que um componente se torne defeituoso, seja ou não muito quente. Suponha, por exemplo, que 1 em cada 100 componentes seja defeituoso em geral. Então p (defeituoso) é 0,01. P (quente) é a probabilidade de um componente funcionar quentes, seja ou não defeituoso. Suponha, por exemplo, que 1 em cada 20 componentes seja muito quente, seja ou não defeituoso. Então, p (quente) é 0,05. Isso nos dá: de fato, nessas circunstâncias, se um componente testar como defeituoso com base em sua temperatura, a probabilidade de que seja realmente defeituosa é de apenas 20, e não de 99,5. Isso pode ter profundas conseqüências se você estiver usando este teste para determinar quais componentes vender e quais remover os lixo. Derivando o teorema de Bayes Nesta seção, vou mostrar como o teorema de Bayes, na forma expressa acima, pode ser derivado de nosso procedimento de tabulação e contagem. Lembre-se de que a quantia que queremos calcular é a probabilidade de ganhos da Dogmeat dado que está chovendo. Vamos escrever esta p (wr) (probabilidade de ganhar chuva dada). O que sabemos desde o início é a probabilidade de chover em ocasiões que a Dogmeat ganha. Vamos escrever esta p (rw). Agora p (rw) é apenas uma probabilidade, e pode ser determinado dividindo o número de vezes que Dogmeat ganhou em um dia chuvoso, pelo número de vezes que ele ganhou no total. Nos símbolos, expressamos isso: n (r e w) é o número de vezes que Dogmeat ganhou em um dia chuvoso, e n (w) é o número de vezes que ele ganhou no total. Dividindo a parte superior e inferior do lado direito por N, o número de corridas, temos: Mas o número de vezes real dividido pelo número de possíveis coisas é apenas a probabilidade de algo. Isso é o que significa probabilidade. Então, podemos escrever: isto é, a probabilidade de chuva, dado que o Dogmeat ganha, é a probabilidade de que a Carne do Doge vença e chove, dividida pela probidade de sua vitória. E, se nós simplesmente trocamos os símbolos ao redor, também podemos escrever: Nós não temos provado nada aqui, basta trocar símbolos r por w. Mas se escrevemos a equação anterior assim: podemos substituir p (r e w) na versão anterior (antes de trocarmos r e w), e isso nos dá: ou, com um pouco de simulação de símbolos: E isso É o teorema clássico de Bayes. Conclusão Eu tentei mostrar neste artigo que não há nada de místico ou profundo sobre o teorema de Bayes, embora, é claro, apenas arranjei a superfície de como ele pode ser aplicado na prática. O teorema realmente não nos permite calcular qualquer coisa que não possamos descobrir por outros meios, mas tem a vantagem de ser notação compacta, e funciona diretamente com probabilidades em vez de contagens. O método de Bayes freqüentemente produz resultados que estão em contraste com nossa compreensão intuitiva. Considere o exemplo notório da impressão digital: é intuitivo que, se a probabilidade de dois povos terem as mesmas impressões digitais for uma em cada 100.000, então encontrar a impressão digital da pessoa X em uma arma do crime significa que a pessoa X é o assassino. Ou, pelo menos, significa que a pessoa X teve sua mão na arma do crime em algum momento. Mas, de fato, isso não significa nada disso. A informação que temos é, em certo sentido, p (impressor digital X), o que precisamos é p (pessoa Xfingerprint). Para resolver isso, precisamos saber também p (pessoa X) e p (impressão digital). P (pessoa X) é a probabilidade de que a pessoa X seja o culpado, deixando de lado a evidência de impressão digital p (impressão digital) é a probabilidade de que a impressão digital particular seja encontrada na arma, deixando de lado qualquer outra evidência. Agora, é altamente provável (perdoa o troco) que não conhecemos p (pessoa X) ou p (impressão digital) com qualquer precisão. Mas o ponto importante é que se p (pessoa X) é muito inferior a p (impressão digital) (talvez porque a pessoa X tenha um alibi muito forte), então a probabilidade de a pessoa X ser inocente será muito superior a uma em cada 100.000 . A suposição incorreta que é o que é conhecido como a falácia do promotor na ciência forense, e Bayes nos diz o quão grave é um erro. Cópia de direitos autorais 1994-2017 Kevin Boone. Atualizado em 12 de maio de 2017

No comments:

Post a Comment