sábado, 23 de julho de 2011

Lei de Benford

 
Abordaremos neste post um fato muito interessante: A Lei de Benford. Mas o que é exatamente a lei de Benford?
Bem, a Lei de Benford, também conhecida como a "Lei dos Primeiros Dígitos", é uma ferramenta muito poderosa e muito simples que aponta suspeitas de fraudes, fraudadores, sonegação de impostos, contabilístas mediócres e erros de digitação.

Aqui vai uma questão de probabilidade:

"Dada uma amostra de números aleatórios de uma fonte de dados qualquer, qual a probabilidade do primeiro dígito ser 1? E de ser 5? E 9?"

Ora, logicamente pensaríamos que todos os dígitos (de $1$ à $9$) possuem a mesma probabilidade de aparição ($P_n=1/9$), ou seja, 11,11% para cada. Saiba que no "mundo real" a probabilidade da aparição de cada número ocupando o primeiro dígito difere!
Em nosso caso seja $P_n$ a probabilidade de aparição do número $n$, $n\in\left\{1,\ldots,9\right\}$, temos:
$P_1=0,3010$, ou seja, 30,10%
$P_5=0,0792$, ou seja, 7,92%
$P_9=0,0458$, ou seja, 4,58%

Em 1881, um matemático e astrônomo americano, Simon Newcomb, percebeu que as primeiras páginas dos livros de logaritmos das bibliotecas estavam mais gastas que o resto, intrigado com isso ele investigou o assunto mais profundamente e percebeu que em amostras aleatórias de dados reais os números de 1 à 9 no primeiro dígito de um número não obedeciam a distribuição mais intuitiva, de 1/9, porém os números menores apareciam com maior frequência, o dígito 1 aparece quase 1/3  das vezes.
  Newcomb publicou no mesmo ano um breve artigo no jornal americano de matemática, neste artigo ele especulava a probabilidade de um número $d$ aparecer como o primeiro dígito seria de $\log_{10}\left(1+\frac{1}{d}\right)$ , ele intitulou este artigo como "Note on the frequency of use of the different digits in natural numbers".

Mais tarde, em 1938, o físico Frank Benford após uma investigação mais profunda chegou a mesma conclusão que Newcomb, indo mais além aplicando a fórmula em uma variedade de números para detectar o fenômeno da ocorrência de dígitos. Em 1995, Theodore P. Hill publicou uma demonstração matemática rigorosa e nela mostrou que os números da sequência de Fibonacci obedecem rigorosamente à lei.

Enunciamos agora esta lei:
"Dizemos que um conjunto satisfaz à Lei de Benford se o dígito inicial $d$  ($d\in\left\{1,\ldots,9\right\}$) ocorre com a seguinte probabilidade:
$P(d)=\log_{10}(d+1)-\log_{10}d=\log_{10}\left(1+\frac{1}{d}\right)$
A tabela abaixo mostra o cálculo dessas probabilidades para esses números: 
Aplicações:

1. Sucessão das potências de 2
Consideremos a sucessão das potências de 2, $\left(2,2^2,2^3,\ldots\right)$, e tomemos os primeiros dígitos dessas potências, vemos que obedecem à lei de Benford. Para verificar isso, tomemos uma amostra dessa sucessão, suponha os números de $2$ até $2^{100}$, vejamos as que começam com o dígito $1$:
$2^4=16$                   
$2^7=128$
$2^{10}=1024$ 
$2^{14}=16384$ 
$2^{17}=131072$ 
$2^{20}=1048576$
$\vdots$         $\vdots$ 
$2^{100}=1267650600228229401496703205376$
Um fato interessante é que as potências obedecem à uma P.A. de razão alternada na sequencia $3,3,4,3,3,4,3,3,4,\ldots$, ou seja, temos $32$ potências que começão com o algarismo $1$, isso dá 32% dos casos, veja como esse valor se aproxima da lei, se continuássemos esse processo veríamos que esse valor se aproximaria de 30,1%.

2. Sequência de Fibonacci
Os primeiros dígitos da sequência de Fibonacci (1,1,2,3,5,8,13,...)também obedecem à lei de Benford.
No caso dos 100 primeiros números da sequência temos:

DÍGITO          OCORRÊNCIA        PROBABILIDADE
  1                      30                            30 %
  2                      18                            18 %
  3                      13                            13 %
  4                       9                              9 %
  5                       8                              8 %
  6                       6                              6 %
  7                       5                              5 %
  8                       7                              7 %
  9                        4                              4 %

No caso da sequência com os 10.000 primeiros elementos:

DÍGITO          OCORRÊNCIA          PROBABILIDADE 
   1                      301                       30,1 %
   2                      177                       17,7 %
   3                      125                       12,5 %
   4                       96                         9,6 %
   5                       80                         8,0 %
   6                       67                         6,7 %
   7                       56                         5,6 %
   8                       53                         5,3 %
   9                       45                         4,5 %

Note que os valores se aproximam dos valores da lei.
3. CONTABILIDADE: AUDITORIA FISCAL
Uma importante aplicação da Lei de Benford (porque não dizer a principal) é na Auditoria Fiscal, esse ramo da contabilidade examina se existem fraudes nas contas de empresas, bancos, instituições, e se utilizam da lei de Benford para checar se os dados são verídicos ou se foram inventados. Foi Mark Nigrini da Universidade do Sul de Methodist que abriu caminho para a aplicação da Lei de Benford à sonegação de imposto e a detecção de fraudes. Nos EUA, evidências baseadas na Lei de Benford é legalmente admissível em casos criminais de níveis federais, estatais e locais.

Generalização da Lei de Benford
A lei de Benford pode ser generalizada para encontrar a probabilidade de encontrarmos uma sequencia de dígitos iniciais. Em particular, a probabilidade de encontrarmos um número iniciando com uma sequencia de números $n$ é dada por:
$\log_{10}(n+1)-\log_{10}\left(1+\frac{1}{n}\right)$
  Por exemplo, a probabilidade de que um número se inicie com os dígitos 3,1 e 4 é $\log_{10}(1+1/314)\approx 0,0014$)
Podemos calcular a ocorrência de um certo dígito sem ser a primeira posição. Por exemplo, a probabilidade que o algarismo 2 seja encontrado como segundo dígito é 
$$\log_{10}\left(1+\frac{1}{12}\right)+\log_{10}\left(1+\frac{1}{22}\right)+\cdots+\log_{10}\left(1+\frac{1}{92}\right)\approx 0,109$$

Generalizando, a probabilidade que $d\quad (d=1,2,\ldots,9)$ seja encontrado como o    $n$-ésimo $n>1$ dígito é:
$$\sum_{k=10^{n-2}}^{10^{n-1}-1}\log_{10}\left(1+\frac{1}{10k+d}\right)$$ 
Na prática, a aplicação da Lei de Benford à detecções de fraudes geralmente usam mais do que o primeiro dígito.





  

13 comentários:

  1. Olá, Diego!
    Achei esse assunto, muito interessante até porque... sabendo disso agora, as minhas escolhas para os números que eu marcar nos cartões das loterias, terão nos primeiros dígitos, uma preferência maior. Probabilidade não dá certeza, mas... ajuda blz nessas horas!
    Post muito legal e muito bem escrito, meus parabéns!
    Um abraço!!!!!

    ResponderExcluir
    Respostas
    1. A Lei não se aplica a sorteios de loterias...

      Excluir
    2. Isso mesmo Glaucio, a Lei modela eventos ligados a contabilidade, auditoria, números sequenciais, etc. No caso de um sorteio temos a mesma probabilidade para todos os números pois não estamos falando de uma sequencia de números em uma contagem ou medida.

      Excluir
  2. Obrigado Valdir, uma coisa importante à frisar é que a lei de benford só se aplica para eventos aleatórios, ou seja, podemos criar uma sequência que não obedeça à lei, por exemplo a sequência
    [;9,99,999,9999,\ldots;] não obedece à lei, pois [;P_1=0;] e [;P_9=1;], ou seja, não há chances do dígito [;1;] aparecer, mas o dígito [;9;] tem 100% de probabilidade.
    Resumindo, a Lei de Benford só se aplica para eventos aleatórios, sem a interferência de alguém.
    Obrigado pela visita e volte sempre!

    ResponderExcluir
  3. Se tiver uma amostra de 800 elementos por exemplo, como sei qual a probabilidade de dentro desses 800 numeros começarem com o numero 3?

    ResponderExcluir
  4. Não entendi patavinas!! Tadinha de mim...

    ResponderExcluir
  5. Muito legal! Apesar de ser da área de humanas, consegui compreender sem muita dificuldade. Muito acessível a explicação, parabéns!

    ResponderExcluir
  6. Este comentário foi removido pelo autor.

    ResponderExcluir
  7. Este comentário foi removido pelo autor.

    ResponderExcluir
  8. Olá - Muito interessante esse método. Conheci a partir de um vídeo publicado recentemente nas redes sociais, comentando sobre as possíveis fraudes nas eleições/2018. Seu artigo está muito bem escrito. Porém eu acho muito científico, talvez se ele fosse mais didático ficaria mais fácil o entendimento das fórmulas apresentadas.

    ResponderExcluir
  9. Interessante.
    Como seria a aplicação no caso de resultados das eleições? Fiquei curioso agora.

    ResponderExcluir

Você pode inserir suas fórmulas e equações no formato $\LaTeX$ nos comentários, basta escrevê-lo entre os símbolos $ \$ \ldots \$ $. Por exemplo, se você deseja escrever a seguinte fórmula:

$\lim_{x\to\infty}f(x)=0$

basta digitar a seguinte fórmula:

$ \$ $ \lim_{x\to\infty}f(x)=0 $ \$ $
(Um exemplo mais simples: $x^2=a$ é escrito como \$ x^2=a \$).

Agora é com você, comente à vontade, seu comentário é uma ferramenta fundamental para o crescimento do Giga Matemática!!!